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(54) Titre: PROCEDE D'ECHANGE D'INFORMATION DANS UN SYSTEME MULTIPROCESSEUR 



(57) Abstract 



A multiprocessor system comprises a core memory (RAM), processing units (CPUp 
CPUn), each provided with a cache memory (MCj), a directory (RGp and a management pro- 
cessor (PGj). The core memory (RAM) is connected to an assembly of shift registers (RDM r 
RDMq) in such-a way as to permit, in a cycle of said memory, a parallel transfer, by reading 
or writing, of data blocks. Each cache memory (MCj) is connected to a shift register (RDPj) 
in such a way as to permit a parallel transfer by reading or writing, of data blocks. An assem- 
bly of senes connections (LS r LSn) is provided between the assembly of memory sunt regis- 
ters and the assembly of processor shift registers to permit the transfer of data blocks between gj, 
each pair of associated registers (RDMj-RDPj). The addresses of the data blocks can be trans- 
mitted between processor (CPUj) and core memory (RAM) either by said series connections 
or by a common address bus (BUS A). The architecture according to the invention makes h 
possible to provide a large number of processing units while obtaining a high output from 
each processor. 

(57)Abrege 

L'invention concerne un systeme multiprocesseur du type comprenant une memoire centrale (RAM), des proces- 
seurs de traitement (CPUpCPUJ, chacun dote d'une memoire-cache (MCj), d'un repertoire (RG?) et d'un processeur de 
gestion (PGi). La memoire centrale (RAM) est connectee a un ensemble de registres a decalages (RDM r RDM„) de fa5on 
a permettre, en un cycle de cette memoire, un transfert parallele en lecture ou ecriture des blocs d'informations. Chaque 
memoire-cache (MG) est reliee a un registre a d6calage (RDPj), de facon a permettre un transfert parallele en lecture ou 
ecriture des blocs d'informations. Un ensemble de liaisons series (LS r LSn) est prevu entre l'ensemble des registres a d6ca- 
lage memoires et l'ensemble des registres a decalage processeurs, pour permettre le uansfert de blocs d'informations entre 
chaque paire de registres associes (RDMj-RDPj). Les adresses des blocs d'informations peuvent etre transmiscs entre pro- 
cesseur (CPUs) et memoire centrale (RAM), soit par l'entremise de ces liaisons series, soit par un bus commun d'adresses 
(BUSA). L'architecture conforme a l'invention permet de prevoir un nombre elev6 de processeurs de traitement, tout en 
beneficiant d'un rendement eleve pour chaque processeur. 




SS0022002189 







UNIQUEMENT A TTTRE D'JNFORMAUON 




Codes utilises pour identifier ies Etats parties au PCX, sur les pages de couverture des brochures publiant des 


demandes intemationales en veitu du POT. 




AT 


Autrichc 


FR Fiance 


ML Man* 


AU 


Australia 


GA Gabon 


MR Mauritania 


BB 


Barbade 


GB Royaumc-Uni 


MW Malawi 


BE 


Belgique 


HU Hongrie 


NL Pays-Baa 


BG 


Bulgarie 


IT Italie 


NO Norvege 


EJ 


Benin 


JP Japon 


RO Roumanie 


BB 


BrtsQ 


KP Rdpublique populairc democratiquc 


SD Soudan 


CF 


Republique Centrafricaine 


de Corte 


SE Suede 


CG 


Congo 


KB Ripublique de Carte 


SN Senegal 


CH 


Suisse 


U Liechtenstein 


SU Union sovietique 


CM 


Camera un 


LS Sri Lanka 


TO Tchad 


DE 


Ailemagne, Republiqud fcdirale <T 


LU Luxembourg 


TG Togo 


DK 


Danemart 


MC Monaco 


US Etats-Ums d'Amerique 


n 


Flnlandc 


MG Madagascar 





SS0022002190 



WO 89/06013 



PCT/FR88/00608 



1 

Procede d'echange d' information dans un systeme 
multiprocesseur . 

5 

L 1 invention concerns un systftne 
multiprocesseur de type comprenant une mdmoire centrale, dee 
processeurs de traitement et des m ^moires-caches associSes aux 
processeurs de traitement. Elle s'6tend a un precede* d'echange 

10 d'inf ormat ions entre m6moire centrale et processeurs de 
traitement via la m6 mo i re-cache associ^e a chacun de ces 
processeurs. Elle vise 6galement un nouveau composant circuit 
intdgrS, susceptible d'^quiper le systfcme multiprocesseur. 

On salt que, dans les systemes 

15 m u 1 t i p r o c e s s eu r s connus les plus usuels, toutes les 
informations (donnSes, adresses) transitent par un bus commun 
parallele de communication entre la mdmoire centrale et les 
divers processeurs de traitement, qui constitue un goulot 
d'Stranglement : son d£bit est en effet insuffisant pour 

20 alimenter tous les processeurs a plein rendement, a partir 
d'une m£moire centrale commune. 

Pour augmenter le d6bit de transfert 
d'inf ormations, une premiere solution consiste a associer a 
cheque processeur de traitement une me" moire-cache qui, par la 

25 locality de l'inf ormation, permet de rSduire les demandes vers 
la memoire centrale. Toutefois, dans le cas ou le volume de 
donndes partagdes entre processeurs est substantiel, le 
maintien de la coherence des donn^es entre m£moires engendre 
un trafic d 1 informations compl§mentaire sur le bus de 

30 communication qui suppose a une reduction significative du 
d6bit global sur ce bus et, done, enleve une grande partie de 
son intdrSt a cette solution. 

Une autre solution consiste a rdaliser le bus 
de communication sous la forme d'un r£seau maill£ d6sign£ par 

35 "crossbar", qui permet une communication directe entre cheque 
processeur de traitement et cheque sous-ensemble de la memoire 
centrale ( ban c- mdmo i r e ) . Toutefois, cette solution est trfes 
lourde et tres couteuse a rSaliser du fait du nombre trfcs 
gleve" d'interconnexions, et elle devient totalement irr£aliste 

40 au-dele d'une dizaine de processeurs de traitement. De plus, 
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en cas de demandes multiples de plusieurs processeurs sur un 
m§me banc-me" moire, une telle solution implique des conflits 
d'acces, source de relent issemen t des ^changes. 
5 Une autre solution plus courante en raison de 

sa simplicity architecturele consiste a associer une mSmoire 
locale a cheque processeur de traitement pour stocker des , 
donn£es sp£cifiques a celui-ci, et a n^moriser lea donnles 
partagges dans la m£moire centrale commune. Toutefois, le gros 

10 deTaut de cette architecture est sa non-transparence, c'est-a- 
dire la n£cessite* pour le progremmeur d' organiser le detail 
des affectations des donne*es dans les diverses m^moires, de 
sorte que cette solution est d 1 u t i 1 i s a t i o n tres 
contraignante.. De plus, en cas de volume £leve* de donn£es 

15 partag£es, elle peut conduire comme pr£c£demment a une 
saturation du bus d'acces a la m^moire centrale. 

Par ailleurs, une solution dite "architecture 
aquerius 11 a 6t£ propos6e par l'Universit^ de Berkeley et 
consiste a am£liorer la solution crossbar pre*cite*e en 

20 combinant au rSseau crossbar, d'une part, pour les donndes non 
partage*es, des m^moires-caches qui sont connectSes au re*seau 
crossbar, d'autre part, pour les donn£es partage"es, des 
me* mo i res-caches distinctes qui sont connect£es a un bus commun 
de synchronisation. Cette solution apporte un gain en rapidite* 

25 d'Schenges mais demeure tres lourde et tres couteuse a 
rdaliser. 

La prSsente invention se propose de fournir 
une nouvelle solution, permettant d'augmenter considSrablement 
les debits d'^chsnge d' informations, tout en gardant une 
30 architecture transparente pour l'utili sa teur , beaucoup plus 
simple que 1 1 architecture crossbar. 

Un objectif de l'invention est ainsi de * 
permettre d'augmenter notablement le nombre de processeurs de 
traitement du systeme, tout en b^ndficiant d'un rendement * 
35 e'leve' pour cheque processeur. 

Un autre objectif est de fournir une 
structure de compos ant circuit iht6gr£, permettant une 
realisation tres simple de 1' architecture de ce nouveau 
systeme mult ipr ocesseur . 
AO A cet effet, le systeme multiprocesseur vis6 
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par l'invention est du type comprenant une mgmoire centrale 
(RAM) organised en blocs d'inf or metions (bi), des processeurs 
de traitement (CPU r .. CPUj... CPU n ), une memoire-cache (MCj) 
5 relive a cheque processeur de traitement (CPUj) et organised 
en blocs d'inf ormations (bi) de meme taills que ceux de la 
mdmoire centrale, un repertoire (RGj) et son processeur de 
gestion (PGj) associ^s b cheque m 6 m o i re-cache ( M Cj ) , des 
moyens de communication d'adresses de blocs entre processeurs 

10 (CPUj) et m 6 moire centrale (RAM) ; selon la prSsente 
invention, ledit systeme multiprocesseur est dote* : 

. d'un ensemble de registres a d£calage, dit 
registres a d<§calage m^moire ( RDM j • •• RDMj... RDM R ), cheque 
registre (RDMj) de cet ensemble 6tant connects h la m^moire 

15 centrale (RAM) de fagon a permettre, en un cycle de cette 
mSmoire, un transfert parallele en lecture ou <§criture d'un 
bloc d'inf ormations (bi) entre ledit registre et ladite 
m£moire centrale, 

. de registres a d^calage, dits registres a 

20 d£calage processeur (RDPj... RDPj... RDP p ), cheque reqistre a 
d£calage processeur (RDPj) dtant reli£ a la m 6 moire- 
cache (MCj) d'un processeur (CPUj) de fagon a permettre un 
transfert parallele en lecture ou ecriture d'un bloc 
d'inf ormations (bi) entre ledit registre a riScalage (RDPj) et 

25 ladite m6moire-cache (MCj), 

. d'un ensemble de liaisons seri es (L Sj*.. 
LSj... L5 p ), chacune reliant un registre a d^calage memoire 
( RDM j) et un registre h d<§calage processeur (RDPj) et adapted 
pour permettre le transfert de blocs d'inf ormations (bi) entre 

30 ies deux registres considers (RDM j, RDPj). 

Ainsi, dans le systeme multiprocesseur 
conforme a l'invention, les ^changes entre m6moires-caches et 
processeurs associ^s a'eff ectuent comme dans les systemes 
classiques £quip£s de m£ mo i res-caches. Par contre, les 

35 exchanges entre memoire centrale et m 6 m o i r e s-c ac h e s 
s'effectuent de facon entierement originale. 

Chaque transfert de bloc d'inf ormations (bi) 
depuis la memoire centrale (RAM) vers la m e* moi re-cache (MCj) 
d'un processeur donne* (CPUj) consiste : 

40 . a transferer, en un cycle de memoire 
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centrale, le bloc (bi) de ladite memoire centrale (RAM) vers 
le registre a decalage memoire (RDMj) (de la taille d'un bloc) 
qui est directement connects a la memoire centrale et qui 
5 correspond au processeur. (CPUj) consider, 

a transferer sur la liaison serie 
correspondan te (LSj) le contenu de ce registre a decalage 
memoire (RDM j) vers le registre a decalage processeur (RDPj) 
(de mime capacity) qui est associe a la memoire-cache (MCj) du 
10 processeur consider (CPUj), 

. h transferer le contenu dudit registre a 
decalage processeur (RDPj) vers ladite memoire-cache (MCj). 

Dans le sens oppose, cheque transfert de bloc 
d' informations (bi) depuisla m^moire-cache ^ M C j ^ d ' un 
15 processeur donne (CPUj) vers la memoire centrale (RAM) 
consiste s 

. b transferer le bloc (bi) de ladite 
memoire-cache considdree (MCj) vers le registre a decalage 
processeur (RDPj) qui est associe b ladite memoire-cache 
20 (MCj), 

b transferer sur la liaison serie 
correspondan te CLSj) le contenu du registre a'd€calage 
processeur (RDPj) vers le registre a decalage memoire (RDMj), 
affecte au processeur consider (parmi l'ensemble de registres 
25 a decalage (RDM RDMj... RDM n ) connects a la memoire 

centrale (RAM)), 

• a transferer, en un cycle de memoire 
centrale, le contenu du registre a decalage memoire (RDMj) 
vers ladite memoire centrale (RAM). 

30 Dans ces conditions, le transfert de cheque 

bloc d r inf ormations (bi) s'effectue, non plus a travers un bus 
parallele comme c'est le cas dans les systemes connus, mais 
par des liaisons series h haut debit* Ces liaisons series 
permettent d f obtenir des temps de transfert de cheque bloc 

35 (bi) comparables et meme inf6rieurs aux temps de transfert 
dans les systemes connus b bus parallele. L'exemple comparatif 
ci-dessous donne evec des valeurs de perametre courantes pour 
la technologie actuelle, illustre clairement ce fait qui 
semble paradoxal* 

AO On suppose que cheque bloc d 1 inform at ions 
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(bi) est d'une taille Sgale & 64 octets. 

Dans le 8ysteme de 1 ' in v en t i on , le temps de 
transfert entre la mSmoire centrale et une m<* moire-cache se 
5 decompose en : 

- un temps de transfert me*moire centrale 
( RAM)/regi s t re a d^calage m^moire (RDM j) : 100 nanosecondes 
(performance d'une mSmoire centrale a acces al<§atoire de type 
courant ) f 

10 - un temps de transfert s£rie sur la liaison- 

s<§rie correspondant e : 64 x 8 x 1/500. 10 6 , soit 1 024 
nanosecondes, en supposant une frequence do transfert de 
500 Megahertz (non excep t ionnel le avec lea technologies 
actuelles qui autorisent des frequences atteignant 

15 3 000 Megahertz), 

- un temps de transfert registre b d^calage 
processeur ( RDP j ) /m§ m o i re-c ache (MCj) t 50 nanosecondes 
(m^moire-cache de type tres courant). 

Le temps de transfert total d'un bloc est 
20 done de 1'ordre de 1 200 nanosecondes (en integrant des dtflais 
d 1 enchainement de second ordre). 

Dans lea systemes connus a mSmoires-caches 
dans lesquels les ^changes d' informations s'ef fectuent 
directement en parallele par mots de 4 octets (systemes les 
25 plus courants conduisant a des bus de type habituel a 32 fils 
de donne'es), le temps de transfert d'un bloc est 6gal au temps 
de transfert des 16 mots de 4 octets qui constituent ce bloc, 
c »est-e-dire : 16 x 100 s 1 600 nanosecondes. 

On voit dene que, avec des hypotheses 
30 moyennes dans les deux auiutiutis, ues temps sont comperables. 
Or, si l'on compare I'archi tecture du systeme conforme a 
1'invention et celle a bus parallele commun avec mdmoires- 
caches (premiere solution 6voqu6e pr£c6demmen t) , l'on constate 
que: 

35 # dans la solution classique (bus commun 

parallele), la m^moire centrale et le bus commun sont occup^s 
a 100 % pendant le transfert, puisque des informations 
circulent entre les deux pendant toute la dur£e du transfert, 
. dans le systeme conforme b l 1 invention, la 

40 liaison s6rie est occupSe a 100 % pendant le transfert, mais 
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la memoirs centrale est occup^e moins de 10 % du temps de 
transfert (temps de lecture mSmoire et de chargement du 
registre h d^calage m£moire (RDM j)), de sorte que la m£moire 
5 centrale peut servir 10 fois plus de processeurs que dans le 
cas precedent ( 1 'occupa t i on de la liaison serie etant sans 
importance puisqu'elle est priv6e et affect^e au processeur). 

II faut souligner, par ailleurs, que dans le 
systfeme de l'invention, chaque liaison s£rie qui relie chaque 

10 processeur de fagon individuelle a la m6moire centrale est une 
liaison simple (a un ou deux fils de donn^es), de sorte que le 
r£seau s£rie ainsi constituS n'est pas comparable sur le plan 
de la complexity avec, par exemple, un r£seau crossbar dont 
chaque liaison est une liaison parallfele fe multiplicity de 

15 fils (32 fils de donn^es dans I'exemple comparatif pr^city), 
avec tous les commutateurs n£cessaires« 

En outre, comme on le verra plus loin sur les 
courbes comparatives, le systfeme conforme a l'invention 
possede des performances tres an61ior6es par rapport aux 

20 systfemes tradi tionnels a bus commun et permet en pratique la 
mise en oeuvre d'un nombre de processeurs de traitement 
beaucoup plus 61ev6 (de plusieurs dizaines a une centaine de 
processeurs) ; ces performances sont compatibles a celles d'un 
systfeme crossbar, mais le systfeme conforme a l'invention est 

25 d'une simplicity arch itecturale beaucoup plus grande. 

Dans le systfeme de l'invention, chaque 
liaison s£rie peut en pratique §tre r^alis^e soit au moyen de 
deux liens-siries unidirectionnels de transfert bit a bit,: 
soit au moyen d'un seul lien bidirectionnel. 

30 Dans le premier cas, chaque registre a 

ddcalage m^raoire (RDM j ) et chaque registre a d^calage 
processeur (RDPj) sont dddoubiys en deux registres, l'un 
spycialis6 pour le transfert dans un sens, I'autre pour le 
transfert dans I'autre sens* Les deux liens-sSries 

35 unidirectionnels sont alors connects au registre a d6calage 
mymoire (RDMj) d^doubiy et au registre a d^calage processeur. 
correspondent (RDPj) d£doubiy, de fagon a permettre, l'un un 
transfert dans un sens, I'autre un transfert dans I'autre 
sens. 

40 Ce mode de realisation a deux liens 
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unidirectionnels pr^sente I'avantage de ne necessiter aucune 
gestion de transfert sup lien, niais l'inconvenient de doubler 
les ressources necessaires (lien, registres). 
5 Da*ns le second cas, une logique de validation 

du sens de transfert est associSe au lien bidirec t ionnel de 
facon a permettre un transfert alterne dans les deux sens sur 
ledit lien* Cette logique peut §tre int<§gr<§e au processeur de 
gestion (PGj) aasocie a la memoire-cache (MCj) a laquelle est 
10 relie" ledit lien bidirect ionnel. 

Bien entendu cheque liaison serie peut 
6 ventuellement etre r6alis6e avec un nombre plus eieve de 
liens series. 

Dans le systeme m u 1 t i pr oc e sseu r conforme a 

15 l'invention, les moyens de communication d'adresses peuvent 
revetir essent iellement deux formes de realisation : en 
premier lieu, ils peuvent consister en un bus de communication 
parallele d'adresses de blocs (BUSA), commun a tous les 
processeurs (CPUj) et reliant ces derniers et la memoire 

20 centrale (RAM) avec de fagon classique un arbitre de bus (AD) 
adapts pour g6rer les conflits d'acces audit bus. II faut 
noter que ce bus d'adresses n'est utilise que pour la 
communication des adresses de blocs : sur le plan de la 
structure, ce bus est identique au bus de communication 

25 parallele d'adresses des systemes connus, pour lequel ne se 
pose aucun probleme de saturation, puisqu'il peut etre lib<§r<* 
aussit&t apres transfert de l'edresse de bloc. 

Toutefois, un autre mode de realisation de 
ces moyens de communication d f adre8ses peut §tre envisage dans 

30 le systeme mult iprocesseur de l'invention, consistent a 
exploiter les liaisons series de transfert des blocs 
d'inf ormations (bi) pour transferer les adresses de ces blocs. 

* Oans ce cas, un registre a decalage 
compiementaire (RDCj) est connects sur cheque liaison serie 

• 35 (LSj) en parallele avec le registre a decalage memoire 

correspondent (RDMj) : les adresses transmises par ladite 
liaison serie sont ainsi chargees dans checun de ces registres 
compiementeires (RDCj) ; un arbitre de gestion d'ecces (ABM) 
relie auxdits registres (RDCj) et a la memoire centrale (RAM) 
40 est alors pr^vu pour preiever les adresses contenues dans 
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lesdits registrss et pour g6rer les conflits d'accfes b la 
raSmoire centrale (RAM). Un tel arbitre est de conception 
connue en elle-meme, ce type de conflits d'accfes dtant 
5 roaintenant rSsolu depuis de nombreuses ann^es. Dans ce mode de 
realisation, on 6vite la presence d'un bus parallfele de 
communication d'adresses, mais les ressources en gestion sont 
alourdies. 

Par ailleurs, le systeme mul tiprocesseur 
10 conforme b I'invention est particuliferement bien adapts pour 
g6rer de facon performante les problfemes de coherence des 
donn^es partag^es entre processeurs de traitement. En effet, 
les solutions classiques pour gSrer ces donndea parteg6es 
trouvent leur limite dans les systfemes connus du fait du 
15 goulot d'£ tr anglement au niveau de la communication des 
informations, mais deviennent au contraire parfaitement 
satisf aisantes et performantes dans le systfeme de I'invention 
ou un tel goulot n'existe plus, de sorte que ce Bysteme peut 
fctre £quip£ de moyens de gestion des donates partagSes de 

29 conception analogue b ceux des syst&mes connus. 

Par example, une solution tradi tionnelle de 
gestion des donn^es parteg£es consiste b gviter que celles-ci 
transitent par les mgmoires-caches : de facon classique, une 
logique de pa-rti.tion (LPj) est associe'e b chaque processeur 
25 de traitement (CPUj) en vue de diff^rencier les adresses des 
donnees partagSes et celles des donn^es non partagdes de facon 
b aiguiller les premieres directement vers la mdmoire 
centrale (RAM) et les secondes vers la m 6 m o i r e -c a c h e 
correspondante (MCj). * 

30 Dans une premiere version de I'architecture 
conforme b l'invention, le systeme comprend : 

• un bus special de communication parallele 
de mots (BUSD) reliant les processeurs (CPUj) et la mSmoire 
centrale (RAM), 

35 . une logique de partition (LPj), associ^e.fc 

chaque processeur (CPUj) et adaptde pour diff^rencier les 
adresses des donn£es partag£es et celles des donndes non 
partag£es de facon b transmettre celles-ci sur les moyens de 
communication d'adresses avec leur identification, 

40 . une logique de dScodege (DEC) associde b la 
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memoire centrale (RAM) et adapt6e pour recevoir les adresses 
avec leur identification et aiguiller les donnees en sortie 
memoire soit vers le registre b ddcalege memoire correspondent 
5 ( RDM j ) pour les donnees non partagees, soit vera le bus 
special de communication de mots (BUSD) pour les donnees 
partagees • 

Cette solution prSaente l'avantage d^tre 
tres simple sur le plan architectural ; la presence du bus 

10 special de communication parallele (BUSD) conduit & de 
meilleures performances par rapport b une solution qui 
consisterait b utiliser les liaisons series pour transferer 
non seulement les blocs de donnas non partagees mais 
egalement les mots de donnees partag^es. II est b noter que 

15 cette derniere solution peut, le cas 6ch£ant, §tre envisagSe 
en cas de faible taux de donnees partagees. ( 

Dans une autre version, le systeme est dote 
d'un bus special de communication parallele de mots (BUSD) et 
d*un bus special commun de communication d'adresses de mots 

20 (BUSAM), reliant les processeurs (CPUj) et la memoire 
centrale (RAM). La logique de partition (LPj) aiguille les 
adresses des donn^es partagees vers le bus special commun 
(BUSAM) en vue du transfert des donnees par le bus special de 
mots (BUSD), et aiguille les donnees non partagees vers les 

25 moyens de communication d'adresses (que ceux-ci soient 
constitu6s par un bus parallfele de communication ou que la 
communication s'effectue via les liaisons series). 

La presence d'un bus special de communication 
d'adresses de mots permet, dans cette version, de reculer la 

30 limite de saturation des moyens de communication d'adresses, 
en cas de demandes eievSes de donnees partagees. 

Une autre version qui sera pr^f^ree en 
pratique dans le cas ou les moyens de communication d'adresses 
sont constitues par un bus parallele de communication 

35 d'adresses (BUSA), consiste b equiper le systeme d'un 
processeur de gestion memoire (PGM) associe b la memoire (RAM) 
et d'un processeur espion de bus (PEj> associe b chaque 
processeur de traitement (CPUj) et au repertoire de gestion 
correspondent (RG j) ; le processeur de gestion memoire (PGM) 

40 et chaque processeur espion de bus ( PE j ) , de structures 
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connues en soi, sont connects eu bus de communication 
d'adresses (BUSA) en vue respect ivement de surveiller et de 
traiter les adresses de blocs transmises sur ledit bus de 
5 fagon a permettre une roise a jour de la memoire centrale (RAM) 
et de la memoire-cache associ^e (MCj) en cas de detection 
d'une adresse.de bloc prSsente dans le repertoire associe 
(RGj). 

Le processeur de gestion memoire (PGM) et 

10 cheque processeur esplon (PEj) associent des bits d f 6tat a 
cheque bloc d* inf ormat ions, les tiennent a jour en fonction de 
le nature (lecture ou ecriture) des demandes de bloc qui 
transitent sur le bus (BUSA) et assurent la coherence des 
donn£es partag^es en utilisant ces bits d'etats qui leur 

15 permettent de forcer ou non l'ecriture d'un bloc en memoire 
centrale au moment des demandes sur le bus (BUSA). 

Dans le c a s 6 v o q u e prdcedemment ou les 
communications d'adresses se font par les liaisons series, la 
gestion des donnSes partag£es peut egalement etre assur^e de 

20 fagon centralis^e, par un processeur de gestion memoire (PGM) 
associe a la memoire centrale (RAM) et un processeur de 
maintien de le coherence des donnees partagees (PMCj) associe 
a chaque processeur de traitement (CPUj) et au repertoire de 
gestion correspondent (RGj), chaque processeur de maintien de 

25 coherence (PMCj) etant connects a un bus de synchronisation 
(SYNCHRO) pilots par le processeur de qestion memoire (PGM), 
de fagon a permettre une mise a jour de la memoire centrale 
(RAM) et de la mdmoire-cache associ£e (MCj) en cas de 
detection d'une pdrRoee. Ho h]nc, une mise a jour de la memoire 

30 centrale (RAM) et des memoires-caches (MCj) a chaque 
preievement d'adresses dans les registres a decalage 
compiementaires (RDCj). 

Comme pr6ce dem men t , cette mise a jour est 
a s s u r e e grace a des bits d'etat associes a chaque bloc 

35 d ' inf ormation par le processeur (PGM). 

II est a noter qu'un bus de synchronisation 
du type ci-dessus defini peut le cas echeant § t r e prevu sur 
1'architecture precedente ou les adresses de blocs transitent 
sur un bus commun d'adresses BUSA* Dans ce cas, les 

40 processeurs espions (PE.) sont sollicites par le processeur de 
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gestion mSmoire (PGM) via le bus de synchronisation, et ce, 
uniquement lorsqu'ils sont concern^ par le transfert. On 
6vite ainsi das accfes inutiles vers les mSrooires-ceches 5 lea 
5 processeurs espione deviennent alors passifs (puisque 
sollicit<§s par le processeur PGM) et on les designers plut6t 
par l ! expresaion plus appropri6e de "processeur de maintien de 
la coherende" selon la terminologie ci-dessus utilisSe. 

Une autre solution consiste b r^server le bus 
10 parallfele de communication d'adressee (BUSA) au transfert des 
adresses des blocs de donni§es partag£es et b utiliser les 
liaisons series pour le transfert des blocs de donn^es non 
partag^es. 

Par ailleurs, le systeme multiprocesseur 
15 conforme b ^invention se pr§te b des regroupements de 
-processeurs de traitement sur une m§me liaison sdrie, de fagon 
b iimiter les liaisons series et les registres b ddcalage 
m^moire correspondent ( RDM j ) n6cessaires. 

Le nombre de registres b d£calage m6moire 
20 (RDM j) peut correspondre au nombre de liaisons series (LSj), 
auquel cas cheque registre h ddcelage mdmoire ( RDM j ) est 
connects de facon stetique b une liaison s <§ r i e (LSj) 
sp6cif iquement affect^e audit registre. 

Le nombre de registres b d^calage mSmoire 
25 (RDMj) peut Sgalement fctre different de celui des liaisons- 
sdries (LSj) et notamment inf<§rieur, auquel cas ces registres 
sont connects de fagon dynamique aux liaisons sdries (LSj) 
par I'entremise d'un r6seau d 1 interconnexion . 

Comme dans les systemes classiques, la 
30 mizoizz csntrsle (RAM) peut et re divis^e en m bancs m^rooires 
(RAM RAM p ... RAM m ) agenc6s en perall&le. Cheque registre b 

d^calage miSmoire (RDM j ) est alors constitu<§ de m registres 
(§16mentaires (RDM^... RDM jp ... RDM jm ) relics en perellfele b 
la liaison sSrie correspondante (LSj). Cependant, un niveau de 
35 parall^lisme supp 1 <§ m en t a i r e et une meilleure adaptation 
dlectrique ou optique de la liaison sont obtenus dans une 
variante oil cheque banc m^moire RAM p est reli6 b cheque 
processeur CPUj par une liaison s6rie en point b point LSj p . 

Par ailleurs, pour presenter des performances 
40 de transfert au moins Sgales b celles des systemes classiques 
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a bus parallele, le systeme conforme a l'invention est de 
preference synchronise par une horloge de frequence F au moins 
e.gale a 100 megahertz. Les registres a decalage memoire (RDMj) 
5 et registres a decalage procasseur (RDPj) peuvent tres 
simpleraent §tre d'un type adapte pour presenter une frequence 
de decalage au moins £gale a F. 

Dans le cas de tres hautes frequences 
(notamment supdrieures a 500 megahertz avec la technologie 

10 actuelle), on peut diviser ces registres en sous-registres de 
frequence de decalage plus faible, et les multiplexer. 

L'invention s'etend a un composant n^moire 
multiport sSrie, susceptible d'6quiper le systeme 
mult iprocesseur precedemment defini, en vue d'en simplifier la 

15 fabrication. Ce composant, qui peut par ailleurs avoir des 
applications diff£rentes, est constitue par un circuit int€gre* 
comprenant une memoire a acces aieatoire (RAM) de largeur 
predeterminee correspondent a un bloc d'inf ormations (bi), un 
ensemble de registres a decalage (RDMj... RDMj... RDM n ),' 

20 chacun de capacity correspondent" a la largeur de la n^moire, 
un bus parallele interne (BUSI) reliant l'acces de la memoire 
et les registres a decalage, une logique de selection d'un 
registre a decalage (LSR) adaptee pour valider la liaison sur 
le bus interne entre la memoire et un registre a decalage 

25 predetermine, et un ensemble de broches externes 
d' entree/sortie pour 1' entree d'adresses vers la 
memoire (RAM), pour l'entree d'adressea vers la logique de 
selection (LSR), pour l'entree et la validation de commandes 
d: transfert en. lecture ou ecriture" d'un Dloc 

30 d ' informations (bi) entre la memoire (RAM) et les registres a 
decalage (RDMj), pour l'entree d'un signal d'horloqe vers 
cheque registre a decalage (RDMj), pour l'entree bit a bit 
d'un bloc d'inf ormations (bi) vers cheque registre a decalage 
(RDMj) et pour la sortie bit a bit d'un bloc d'informations 

35 de chaque registre a decalage (RDMj). 

Ce composant peut Stre rendu parametrable par 

I'adjonction de registres de configuration (RC^i R C 2 » • • • ^ 
permettant notamment un choix de taille des blocs 
d'informations (bi) et de divers modes de f onctionnement des 
40 registres a decalage. 
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. L'invention ayant ete exposee dans sa forme 
g^n^rale est illustrde par la description qui suit en 
reference aux dessins annexes qui en pr£sentent, a titre non 
5 limitatif, plusieurs modes de realisation ; sur ces dessins 
qui font partie integrante de lo presente description : 

- la figure 1 est un schema synoptique d'un 
premier mode de realisation du systeme mul t iprocesseur 
conforme a l'invention, 

10 - la figure 2 est un diagramme donnant la 

courbe calcul^e de performance de ce systeme (A) et, a titre 
de comparaison, la* courbe (B) c o r r e s p o n d a n t e pour une 
architecture mul tiprocesseur conventionnel le a bus commun, 

- les figures 3, 4 et 5 sont des schemes 
15 logiques detailies d'unites f one tionnel 1 es du systeme de la 

figure l f 

- la figure 6 est un scheme synoptique d'un 
autre mode de realisation du systeme, 

- la figure 7 est un schema synoptique d'un 
20 systeme du type de celui de la figure 1, dote de moyens de 

gestion des donnees partagees, 

- la figure 8 est un schema logique detail 
d'un sous-ensemble du systeme de la figure 7, 

- la figure 9 est un schema synoptique d'un 
25 systeme analogue a celui de la figure 7 avec une variante de 

moyens de gestion de donnees partagees, 

- la figure 10 est un schema synoptique d'un 
systeme analogue, dote de moyens de gestion de donnees 
partagees differents, 

30 - les figures 11, 12a, 12b, 12c, 12d, U f 14, 

15, 16, 17 sont des schemes logiques d e t a i 1 1 es . d 'un i t e s 
f onctionnelles du systeme processeur de la figure 10, 

• la figure 18 est un schema synoptique d'un 
systeme du type de celui de la figure 6, dote de moyens de 

35 gestion de donnees partagees, 

- la figure 19 est un scheme synoptique 
simplifie d'une variante de systeme, dans laquelle plusieurs 
unites centrales partagent un meme lien-serie, 

- la figure 20a est un schema synoptique d'un 
40 mode de realisation prefer6, dans lequel la memoire centrale 



SS0022002203 



WO 89/06013 PCT/FR88/00608 

14 

est organisge en plusieurs bancs memoires, 

- la figure 20b est une variante de 
1 1 architecture representee & la figure 20a, 

5 - les figures 21a et 21b sch£matisent une 

autre structure de memoire RAM susceptible d'equiper ledit 
syst&me, 

- la figure 22 est un schema synoptique 
presentant la structure d'un composant m^moire raultiport 

10 sdrie, susceptible d'equiper le systfeme. 

Le dispositif .presente sous forme de 
synoptique h la figure 1 est un systfeme mu 1 t iprocesseu r 
poss^dant n processeurs de traitement CPU^... CPUj... c P u n # 0n 
a represents h cette figure deux processeurs de traitement 

15 CPUj et CPUj avec leur logique associ£e. Chacun de ces 
processeurs de traitement est d'un type traditionnel par 
exemple "MOTOROLA 68020" ou "INTEL 80386"... et peut comporter 
des ressources locales en m6moires et en interfaces 
p£riphe riques et etre equipe d'un dispositif de memoirs 

20 virtuelle. 

Le dispositif comprend une memoire centrale 6 
ecc&s aldatoire RAM re*alis£e de fagon classique a partir de 
circuits int£gr£s mdmoires t en particulier RAM dynamique 
"INTEL" "NEC" "TOSHIBA"... de 256 Kbits, 1 Mbits, 4 Mbits... 

25 selon 1 f appl ice t ion. Cette memoire est organised en blocs 
d • i n f b r m a t i o n s bo... bi... de taille t determinee 
(habituellement 256 bits & 2 Kbits) et le front d'ecces de 
ladite memoire correspond h la taille d'un bloc. 

Le nine ire esr.trsls est reliee en parall&le h 

30 n registres h d«§calaqe R D M j • • • RDMj... RDM n dits registres- 
memoire, cheque registre-memoire ayant la taille t d'un bloc 
d'inf or nations ; chacun de ces registres est realise" en d 
technologie trfes rapide ("A5GA"), un bloc pouvant Stre charge 
ou decharge en un cycle de la memoire centrale RAM. Le nombre * 

35 n de registres est egal au nombre de processeurs CPU y 

Par ailleurs, une memoi r e-cache MCj est 
associee de facon connue en soi h chaque processeur CPUj ; 
chaque me m oire-cache est constituee de facon classique per une 
memoire rapide, h eccfes aieatoire, de faible capacite par 

40 rapport & la memoire centrale RAM. Un repertoire RG^ et un 
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processes de gestion PGj sont de fa 9 on tradi tionnelle relics 
a la memoire-cache et au processeur de traitement pour gdrer 
les informations transitant dans la memoire-cache. 
5 En outre, dans le systeme de l'invention, un 

registre b deScalage RDPj dit registre-processeur , est relie 
par son port parallfele, a cheque mdmoire-cache MCj ; chaque 
registre-processeur RDPj est de taille correspondent h celle 
d'un bloc bi et de structure similaire a celle des registres- 
10 mdmoire RDM j . 

Chaque regi st re-memoi re RDM j est relie par 
son port s^rie, au port serie d'un registre-processeur RDPj 
par une liaison serie LSy Des exemples de realisation de 
cette liaison serie qui peut comporter un lien bidirectionnel 

15 ou deux liens unidirectionnels sont illustres aux figures 4 
et" 5. Le contrble du transfert des blocs bi entre registres 
correspondants R D M j et RDPj est assure par des logiques de 
transfert TFRj et TFR'j qui sont associSes de facon symetrique 
au registre-memoire RDM j et au registre-processeur RDPj ; un 

20 exemple de realisation de ces logiques de transfert (en elle- 
memes classiques) est detailie a la figure 3. 

(.'ensemble m<§moire centrale RAM, registres b 
d<§calages memoiree RD M ^ ... R n M n et logiques de transfert 
associees TFR ^ T FR n constituent un ensemble fonctionnel 

25 denomme "memoire multiport serie" M MS. L'ensemble processeur 
de traitement CPUj, memoire-cache MCj, repertoire de gestion 
du cache RGj, processeur de gestion du cache PGj, registre ^ 
decalage processeur RDPj et logique de transfert associee 
TFR'j constitue un ensemble "fonctionnel" denomme "unite 

30 centrale" ui; j . 

Par ailleurs, le systeme comprend des moyens 
de communication d'adresses de blocs des processeurs CPUj vers 
la m6rooire centrale RAM, constitues en l'exemple par un bus 
commun de communication parallele BUSA sur lequel se 
35 connectent les processeurs CPUj (par l'entremise de leur 
processeur de gestion PGj) et la memoire centrale RAM. 

L'acces au bus BUSA e s t re ql em en t e de facon 
classique par un arbitre de bus AB. 

Le f onctionnement general de l'architecture 

40 ci-dessus definie est le suivant : 
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Un processeur CPUj execute un programme 
propre constitue" d'instructions, qui se trouvent sous forme de 
mots en m€moire centrale RAM avec des extraits dens la 
5 mgmoire-cache associ6e MCj* Sur les instructions du programme, 
le processeur CPUj est amene* soit a lire des mots de donn^es 
qui ellea-mem.ea se trouvent dans la mdmoire centrale RAM ou 
dans la memoir e-cache MCj sous forme -d'extraits, soit a gcrire 
des mots de donnSes dans la ro£moire centrale RAM et dans la 

10 me*moire-cache MCj. 

Cheque operation d'un processeur CPUj 
(designee "demande") n€cessite la fourniture de l'adresse adr 
du mot concerns*, la nature r,w de l'op^ration (lecture, 
gcriture) et l'Schange (data) du mot concern^. 

15 -Cheque demande de mot active le processeur 

PGj qui consults alors de f a 9 o n classique le repertoire du 
cache RGj lequel indique si le bloc bi contenant le mot 
concern^ est present dans la me* mo ire-cache MCj et, le cas 
£ch6ant t le cadre de bloc dans la m 6 moi re-cache ou se trouve 

20 le bloc recherche*. 

Si le bloc bi contenant le mot concern^ est 
dans la m€moire-cache MC alors en cas de lecture ce mot est 
lu dans ladite m6moire-cache et envoye* au processeur CPUj ; en 
cas d'6criture le mot fourni par le processeur CPUj est £crit 

25 dans la m <§moire-cache 1 la transaction m^moire est termin^e. 

Si le bloc contenant le mot concern^ n'est 
pas dans la m eVmoi re-cache MCj, alors une lecture de bloc bi en 
mdmoire centrale RAM est n£cessaire. Deux cas peuvent ae 
produire . 

30 Premier cas 

La mSmoire-cache MCj dispose d'au moins un 
emplacement de bloc libre, determine* par le processeur PGj b 
l'aide de bits d'^tata associe*s a cheque entree du 
repertoire RGj. Dans ce cas, le processeur PGj requiert, de 

35 facon classique, le bus BUSA en soumettant se demande a 
l'arbitre de bus AB. Ce dernier eccorde, son tour venu, le bus 
BUSA au processeur PGj qui accede en lecture a la mdmoire 
centrale RAM, le bloc luen m^moire 6 1 a n t c h a r q 6 dans le 
registre RDMj, identifie" par I'origine j de 1'appel. La fin du 

40 cycle de lecture se traduit par la liberation du bus BUSA et 
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l'activation du tranafert avec la liaison s<§rie LSj perraettent 
de transferer le contenu du registre-roemoire RDMj dans le 
registre-processeur RDPj* La fin du transfert active 
5 l'Scriture dans la mdmoire-cache MCj du contenu du registre- 
processeur dans 1 'emplacement de bloc reserve" a cet effet et 
la transaction peut se terminer comme pre*cddemment. 
Deuxieme ess 

La mSmoire-cache MCj ne dispose pas' 
10 d'emplacement de libre alors, par un algorithme classique, un 
emplacement de cache est rendu candidat pour recevoir le bloc 
demanded Deux situations peuvent se rencontrer : 

- le bloc contenu dans 1 'emplacement candidat 
n'a pas 4t4 modifiS depuis son installation : il est 

15 simplement 61imin6 en libelant le cadre de bloc par une simple 
dcriture d'un bit d'etat dans le repertoire (RGj) et la 
transaction peut se poursuivre comme pr6c6demmen t , 

- le bloc contenu dans ^emplacement candidat 
a ete modif i6 et une mise a jour de la m^moire centrale RAM 

20 est ndcessaire. Pour ce f aire, le processeur de gestion PG j 
transfers le bloc candidat dans le registre-processeur SDPj, 
active le transfert du registre-processeur RDPj au registre- 
mSmoire RDM j , puis requiert le bus commun BUSA en soumettant 
sa demande b 1'arbitre AB. Lorsque 1'arbitre accorde le bus au 

25 processeur de gestion PGj, ce dernier active une commande 
d'dcriture qui a pour effet de transferer le contenu du 
registre-m^moire RDMj h son emplacement en m6moire centrale 
RAM. La mise a jour m^moire RAM est terminee et la transaction 
peut se poursuivre comme pr6c6demmen t« 

30 Ainsi, dans le dispositif de l'invention, les 

^changes entre les processeurs -de trsit emen t CPUj.et Teyr 
mgmoire-cache MCj et logiques associe'es RGj , PGj , 
e'effectuent de fagon classique ; par co.ntre, les trsnsferts 
de blocs entre m^moire centrale RAM et me" moire-caches MCj 

35 passent, non plus par un bus parallele commun mais par des 
liaisons-series LSj d^diees b chaque processeur de traitement 
CPUj, le bus commun BUSA ne servant qu'au . transfer t des 
edresses et ayant ainsi un trafic consid£rablemerit allege. 

On salt que, pour les architectures 

40 classiques a bus commun, une mode* 1 isat ion Studied par "PAT EL" 
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(analysis of multiprocessors with private cache, OANAK 
H. PATEL - IEEE Transactions on computers vol* C.31, N° 4 
APRIL 1982) a conduit h la forraule approch6e suivante donnant 
5 le rendement U en fonction du nombre de processeurs en 
presence : 

1 



1 + m (W+tf) 

10 ou 

le rendement U est le.taux moyen d'uti lisation de chaque 

processeur de traitement, 
m est la probability pour qu'un processeur de traitement fasse 
une requite mSmoire, non prSsente dans sa m£ moi re-cache 
15 (cette probability m = p( .Pa est propor tionnelle & la 
probability d'absence Pa de l'inf orma tion dans la m^moire- 
cache et h un facteur fonction de la puissance du 
processeur de traitement ramend h un pourcentage de 
requStes m£moire), 
20 W est le temps moyen d'attente du bus comraun, qui est fonction 
du nombre n de processeurs, 
tf est le temps de transfer t d'un bloc de la m£moire 
centrale vers une m£ moire-cache. 

Les hypotheses h partir desquelles a 6t6 
25 ytablie cette fcrmule montrent que celle-ci est applicable h 
1» architecture conforme h 1' invention, avec un niveau 
d'approximation comparable au niveau d 1 approx i ma t i on de la 
formule pour des architectures classiquee h bus commun. 

_ . .,...11 est a i n s i possible Jo comparer les 
30 performances des deux types d f archi tecture en supposant que 
les composants communs aux deux architectures sont de 
caracty ristiques identiques. 

Le figure 2 donne les courbes obtenues du 
rendement U en fonction du nombre n de processeurs pour les 
35 paramfetres suivants, les paramfetres communs aux deux 
dispositifs Stent identiques, et tous de valeur usuelle : 

- taille du bloc bi = 64 octets, 

- taille du mot pour le transfert parallfele sur bus commun s 
4 octets, 
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- temps d'accfes memoire centrale RAM =100 nanoaecondea , 

- temps du cycle bus BU5A a 50 nanosecondes , 

- frequence de transfert sdrie = 500 Mhz, 

5 - probability d'absence Pa = 0,005 ( me moi re-cache de 
16 Koctets) , 

- facteur de puissance des processeur3 ! oC = 0,5. 

On constate en nomparant las courbea A 
(architecture de l'invention) et B (architecture classique) 

10 que l'architecture conforme b l'invention possfede un renderoent 
nettement supdrieur h 1 ' architecture classique ; 
l'architecture de l'invention permet de mettre en place un 
nombre de processeurs tr§s sup^rieur aux architectures 
classiques a bus commun qui en pratique ne peuvent depasser la 

15 dizaine de processeurs. Par exemple, dans le cas classique, un 
rendement de 0,75 est obtenu dfes le dizieme processeur, alors 
qu'il est obtenu pour plus de 80 processeurs dans le cas de 
l'invention. 

La figure 3 pr^sente un mode de realisation 

20 d'une logique de transfert TF R j ou T F R 1 j permettant de 
transferer un bloc bi d'inf ormation d'un regis tre-memoire RDMj 
vers un registre-processeur RDP j (le transfert inverse ost 
assure par des moyens symetriques non representee h cette 
figure). Chaque logique TFRj ou TFR'j comporte une partie de 

25 contrftle de remission TFR E j et TFRE'j et une partie de 
contr61e de la reception TFRR j et TFRR'j qui sont activees de 
fagon croisSe (emission TFRE j activee en synchronisme avec la 
reception TFRR'j). Le systeme comporte un generateur d'horloge 
H dont la frequence fixe la vitesse de transmission et fournit „ 

30 le signal d'horloge h b la partie emission TFRE j et b la 
partie reception TFRR'j. 

Dans ia partie emission TFREj un registre 
decompteur DC recevant par son entree de chargement load 2 1«* 
signal de lecture F du processeur de gestion PGj permet de 

35 laisser passer t + 1 impulsions d'horloge h b travers une 
porte logique ET1 commandee par un signal de passaqe & zero 
"borrow", la sortie de cette porte ET1 etant reliee b l'entree 
de decomptage "down" du decompteur DC et & l'entree dp 
decalaqe shift! du registre-memoire RDM j* 

40 Dans la partie reception TFRR'j, une bascule 
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B est relive par son entree de donne"e D a la sortie s6rie du 
registre-processeur RDPj, 1'entrSe horloge elk de cette 
bascule Stent relive a l'horloge H pour recevoir le signal h. 
5 Un signal d'initialisation "init" fourni par le processeur de 
gestion PGj est relie* a I'entr^e 5 de la. bascule B et a 
l'entre"e de chargement load3 du registre-processeur RDP y La 
sortie Q de la bascule transmet un signal de commande 
f in_t ransf ert a le porte logique ET2, permettant de laisser 

10 passer le signal d'horloge h vers 1'entrSe de ddcalage shift2 
du registre-processeur RDP j* C e signal de commande est 
dgalement 661ivv6 vers le processeur de gestion PG j pour 
indiquer la fin de transfert de bloc* 

Le fonctionnement de l 1 ensemble est le 

15 suivent 5 le processeur de gestion PGj, apres avoir obtenu 
l'acces a la m£moire centrale RAM via le bus BUSA, effectue sa 
lecture de bloc bi en fournissant l'adresse du bloc concern^ 
et le signal de lecture r. Ce signal de*clenche l'activation de 
la partie Emission TFREj : le front final du signal de lecture 

20 r provoque le chargement du bloc bl dans le registre-m£moire 
RDM j en activant le signal loadl et le chargement de la valeur 
t + 1, corr espondante a la teille en bits du bloc bi plus un 
bit suppl£mentaire dit de "start", dans le registre d^compteur 
DC par le signal load2 ; ceci a pour effet de remettre a 1 le 

25 signal borrow et d'autoriser l'horloge de transfert H a 
fournir, a travers la porte logique ET1 conditionnSe par ce 
signal borrow, t + 1 impulsions d'horloge h : ces impulsions 
ont pour effet de d€caler par I'entrSe shiftl t + 1 bits du 
registre- m^moire RDM.- et de faire atteindre la valeur 0 par 

30 1'entrSe down au d^compteur DC : le signal borrow est remis a 
z6ro et verrouille le fonctionnement de la partie Emission 
TFREj. 

Ainsi, la liaison s6rie LS j , ini ti element a 
l'6tat repos logique 1, transmet le bit 0 dit de start, puis 
35 les t bits du bloc bi, et repasse ensuite a l'gtat repos 
logique 1, le dernier bit 6mis e"tant la valeur 1 forcSe sur 
l'entr£e s6rie du registre-mS moire RDMj. 

En prealable a la demande de lecture, le 
processeur de gestion PGj a initialise* la partie reception 
40 TFRR'f en activant le signal init qui a pour effet de charger 
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le registre-processeur RDPj avec t. bits h 1 par 1'entrSe load3 
et de mettre la sortie Q de la bascule B ^ l'etat logique 1 
par l'entr^e T. Cette sortie Q valide alors la porte logique 
5 ET2 qui laisse passer le signal d'horloge h vers l f entr6e 
shift2 du registre-processeur RDPj. A chaque impulsion 
d'horloge ce registre-processeur fournit un bit sur sa sortie 
sdrie qui est memorise dans la bascule B. Le premier bit 0 qui 
se pr^sente a pour effet de mettre h zero la sortie Q de la 

10 bascule B et verrouiller le signal d'horloge h sur la porte 
ET2. Ce premier bit 0 etant le bit de start qui pr<§cfede le 
bloc bi, ce dernier est done pi<§gS dans le registre-processeur 
RDPj lorsque le processeur de gestion PGj est prSvenu du 
changement d^tat de la bascule B par le signal 

15 f in_transfert : le processeur de gestion PGj n'a plus qu'fc 
venir lire ce bloc bi sur la sortie parallfele du 
registre RDPj. 

L'6criture d'un bloc bi vers la m e m o i r e 
centrale RAM ndcessite la presence d'une logique TFRE'j, 
20 identique h la logique TFRE j, associee au registre-processeur 
RDPj, et d'une logique TFRRj, identique h la logique TFRR'j , 
associee au registre-meraoire RDM j. Dans ce cas, le signal init 
de la logique TFR R j est relie au signal d'Scriture w : la 
liberation du regis tre-m emoire RDM j r^ar^ne automat iquement la 

25 loqique de reception TFRRj. 

Ce mode de realisation de la logique de 
contrfcle du transfert n'est qu'un exemple possible : le 
registre «§tnetteur peut etre en d^calage permanent lui aussi, 
et le registre rdcepteur active pour t impulsions d'horloge 

30 sui- detection du bit de start en debut de transfert . 

L'horloge H peut %tre connects aux deux 
registres, ou deux horloges locales independantes peuvent etre 
utilisees, la synchronisation etant obtenue de fagon classique 
par un preambule dit de .synchronisation. 

35 Le systfeme represente b la figure 4 comprend 

un registre h d6calage memoire dedoubie RDMlj et RDM2 jt un 
registre b decalage processeur dedoubie RDPlj et RDP2j, deux 
liens series unidirectionnels LSlj et LS2j, l'un reliant le 
registre-memoire RDMlj au registre-processeur RDPlj de fa$on o 

40 transmettre le contenu du premier vers le second, l'autre 
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reliant le registre-mSmoire R0M2j au regist re-pr ocesseur RDP2j 
de facon & transmettre le contenu du second vers le premier, 
et des logiques essoci6es pour le contrfile du transfert : 
5 TFRE1 j pour RDM 1 j , T FRR 2 j pour R DM 2 j , TFRE2j pour RDP2j f 
TFRRlj pour RDPlj. 

Pour lire un bloc d'inf ormation bi en m^moire 
centrale RAM, le processeur de gestion PGj initialise par le 
signal init la logique TFRRlj associSe au registre-processeur 

10 RDPlj puis active sa demande de lecture a la m^moire RAM par 
le signal de lecture T. Ce signal active la logique TFRElj 
associge au regis tre-m£moire RDMlj : celle-ci assure le 
transfert sur le lien LSlj du bloc bi d'inf ormation. La fin du 
transfert est d£tect6e par le logique TFRRlj associde au 

15 registre-processeur RDPlj qui pr^vient le processeur de 
gestion PGj de I'arrivle du bloc bi par le signal 
f in_transf ert. Le processeur de gestion PGj transfere alors le 
contenu du registre-processeur RDPlj dans la m£moire- 
cache MC j . 

20 Pour e*crire. un bloc m6moire bi, le processeur 

de gestion PGj charge le registre-processeur RDP2j avec le 
bloc bi concerne* extrait de la me" moire-cache HCj, ce qui 
active le transfert de ce bloc sur le lien LS2j. La logique de 
transfert TFRR2j associSe au registre-m^moire RDM2j assure la 

25 bonne reception de ce bloc. Le processeur de gestion PG j est 
pr€venu de la fin du transfert par le changement d'6tat du 
signal borrow issu de la logique de transmission TFRE2 j. Le 
processeur de gestion PGj effectue alors sa demande d'6criture 
qui devient effective lors de l'activation du signal 

30 d'6criture "w ; celui-ci a pour effet de transferer le contenu 
du registre R D M 2 j dans la mgmoire centrale 'RAM et de 
rdini tialiser pour un prochain transfert la logique TFRR2j. 

Ce dispositif autorise un transfert simultane* 
. de blocs dans les deux sens et permet de traiter plus 

35 rapidement les deTauts de blocs bi dans la m6moire cache MCj 
lorsque cette derniere est satur£e ; 11 autorise ggalement la 
mise en place d'un mecanisme classique d'anticipa tion de 
lecture de blocs* 

Dans un autre mode de realisation presents a 
40 la figure 5, la liaison LSj comprend un seul lien bi- 
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directionnel dote b cheque extremite d'une logique de 
validation L V| et LV 2 constitute par une porte logique 6 2 
entries b collecteur ouvert QC 1 et QC 2 , I'une des entries 
5 etant relive b la sortie serie du registre-mdmoire RDMj pour 
la porte OC^ et du registre-processeur RDP j pour la porte 0C 2 t 
I'autre entree etant relive b la sortie Q d'une bascule de 
commande BCj, et BC 2 ? chacune de celles-ci est relive par ses 
entries S et *R b la logique de transfert TFR pour la bascule 
10 BC 1 et TFR* pour la bascule BC 2 . 

Lectures et 6critures sont effectuees de 
fagon exclusive, & la seule initiative du processeur de 
gestion PGj. 

Une lecture mSrooire active le signal de 
15 lecture 7 qui provoque la mise a 1 de la bascule BC^ par son 
entree if, la remise b z^ro Stent commandee, sur l'entrde R, 
par la logique de transfert TFR b la fin du transfert du bloc. 

Une dcriture m^moire dSclenche un mScenisme 
identique sur la logique de validation LV 2 # 
20 D'autres combinaisons registres/1 iens sont 

possibles, et dans le cas d'un lien b i -d i r e c t i onel , on peut 
notamment utiliser des registres b decalage bi-directionnels 
recevant un signal de sens de transfert. Cette solution 
conduit b I'ut ilisa t ion de registres b decalage plus, complexes 
25 en logique, done a priori moins performants en vitesse de 
transfert . 

La vitesse de transfert devant fetre trfes 
Slev<§e, les registres b d^calages RDM j et RDPj, leurs logiques 
de commandes associ(§es TFR et TFR 1 , les loqiques de 
30 validations LVj et LV 2 , sont choisis dans une technologie 
rapide ( EC L , ASGA), et synchronises par une horloge de 
frequence F au moins 6gale b 100 MHz . 

Une autre solution b registres multiplexes 
pr6sent£e & la figure 21 permet, comme on le comprendra plus 
35 loin, de reduire considerablemen t la quantite de logique 
performante, done couteuse, n^cessaire. 

Le systfeme mul t iprocesseur de la figure 1 
etait dote, b la fois, d'un bus commun de communication 
d 1 ad r esses de bloc et de liaisons-series de transfert de 
40 donnees. La figure 6 presente, en variante, un systeme 



SS0022002213 



WO 89/06013 PCT/FR88/00608 

24 

m u 1 tiprocesseur de raeme principe g^n^ral , mais dens lequel 
donn£es et adresses transitent par lea liaisons series, en 
I'absence de bus coromun. 
5 Ce systeme comprend, en plus des registres- 

m£moires RDM j, des registres a d^calages comply mentaires R n Cj 
aptes a mSmoriser les adresses des blocs demanded et 
controls par une logique de type TF " R j* En outre, un arbitre 
de gestion d'acces ABM est relie* a la m«§moire centrale RAM et 

10 aux registres comple*raentaires RDCj par leur sortie paralleled 
Chaque logique TFRj est relive a cet arbitre ABM de structure 
classique. Le processeur de gestion PGj de chaque m^moire- 
cache MCj est relie* a une partie de l'entr£e parallele du 
registr e-processeur RDPj> en vue d'avoir acces a celui-ci en 

15 Scriture. 

Pour lire un bloc bi en m6moire centrale RAM, 
le processeur de gestion PGj piece l'adresse du bloc demande* 
et la nature de la demande (par un bit de preTixe : 
1 = lecture, 0= 6criture) dans la partie qui lui est 

20 accessible du regis t re-pr ocesseur R np j> ce qui a pour effet 
d'initialiser le transfert de cette information. La logique de 
transfert TFRj ddtecte la fin de transfert sur le registre 
complSmen taire RDCj et active une demande d'ope'retion vers 
1'arbitre ABM ; celui-ci est charge* de s£rialiser et de 

25 traiter les demandes de lecture de bloc en m^moire centrale 

RAM en allant lire l'adresse du bloc demande* dans le registre 

comp!6mentaire RDC • correspondent a la logique de transfert 

J 

e*lue par 1'arbitre ABM, puis en allant lire le bloc en mimoire 
centrale RAM qui sera ensuite charge* dans le registre-m^moire 

30 RDMj et transmis comme pr^cddemment. 

Pour Scrire un bloc en m^moire centrale RAM, 
le processeur de gestion PGj enchaine la transmission de 
l'adresse puis du bloc a 6c r ire 6 travers le re gist re- 
processeur RDPj* Le registre com pigmental re RDCj recoit ainsi 

35 tout d'abord l'adresse et la nature de la demande. 

La logique de transfert T FR j analyse cette 
demande et valide la reception du bloc dans le registre- 
m^moire RDMj du fait de la nature de la demande (Scriture). Ls 
logique de transfert TFRj est prSvenue de la fin de transfert 

AO du bloc bi et transmet alors sa requite de service a 1'arbitre 
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ABM. Cette demands est traitte, son tour venu, par ledit 
arbitre qui active l'tcriture du bloc bi en mtmoire. 

Par ailleurs, le systeme mul tiprocesaeur 

5 represents* a la figure 7 comprend des moyens de gestion des 
donntes partagtes, permettant de traiter, de facon statique, 
le probleme classique du maintien de la coherence des donntes 
partagtes. Ce systeme comprend les ressources du systeme de la 
figure 1 (memes designations) avec les logiques et les 

10 ressources suppltmentaires suivantes : 

Un bus special de communication parallele de 
mots BU5D relie les processeurs CPUj et la mtmoire centrale 
RAM. Une logique de partition LPj est associte a chaque 
processeur CPUj ? chaque logique LPj est constitute de facon 

15 classique par un ensemble de couples r egistres-compara teurs 
connects en parallele sur le bus adresse adr du processeur 
CPUj, en vue de rtaliser une partition de l'espece mtmoire de 
la mtmoire centrale RAM en zone de donntea non partagtes et de 
donntea partagtes, ladite logique LPj dtlivrant a cet effet un 

20 signal p (indiquent le nature des donntes, partagtes ou non). 
Une loqique de dtcodage DEC est associte a la mtmoire centrale 
RAM, elle-m§me amtnagte pour fctre commandte en tcriture par 
mot ou par bloc par ladite logique DEC. 

La logique de dtcodage DEC est dttaillte a la 

25 figure 8 et comporte un dtcodeur DECL, recevant sur son entree 
de donnte la partie adresse mot adrm de l'adresse adr, et 
relit par son entree de validation a la sortie d'une porte 
logique ET3, chaque sortie i dudit dtcodeur ttant relive a un 
"buffer" de validation de sortie BF5 jL . La porte logique ET 3 

30 recoit sur ses entries le signal p et le signal r inverse*. Un 
dtcodeur DECE est relit lui aussi par son entrte de donnte au 
bus adrm, et par son entrte de validation a la sortie d'une 
porte logique ETA, ses sorties ttant relites b un ensemble de 
portes logiques 0Ul i en nombre tgal au nombre de mots dans un 

35 bloc. La porte logique ET4 recoit sur ses entries le signal p 
et le signal w inverst. La sortie de la porte ETA est 
tgelement relite a un ensemble de "buffers" de validation 
d'entrtes BFE 1 , BFE i ... La mtmoire centrale RAM peut etre 
commandte en tcriture par mot- Chaque "tranche" mot ainsi 

AO dtfinie a son entrte de commande d'tcriture w i# Le sortie de 
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cheque porte logique OUl^ est relive k I'entrSe w. de cheque 
"tranche" mot de la mtmoire centrale RAM. 

La figure 8 prdsente en outre le detail de 
5 I'adressage des registres mSmoires RDMj, qui comprend en 
premier lieu un dtcodeur DECEB reli£ par son entree de donnte 
au bus commun BUSA, en vue de recevoir le num6ro j du 
processeur concern^ par la requite de l'unitt centrale UCj ; 
ce dtcodeur DECEB est relit par son entree de validation k la 

10 sortie d'une porte logique ET5 et par ses sorties 1, 2... j & 
des "buffers" de validation BVj, BV j... La porte logique ET5 
regoit sur ses entries les signaux p et w inverses. De mftme, 
un dtcodeur DECLB est relit par son entree de donnte au champ 
j du bus commun BUSA et par son entree de validation k la 

15 sortie d'une porte logique ET6 ; les sorties 1, 2*.. j de ce 
dtcodeur DECLB sont relites aux entries de chargement ldj, ldj 
des registres k dtcalages mtmoire RDM j. La porte logique ET6 
regoit sur ses entries les signaux p et r inverses. 

Le fonctionnement du systfeme est le suivant $. 

20 k cheque rtftrence mtmoire, le processeur CPUj fournit une 
adresse sur son bus adresse adr, et la nature de la requite : 
lecture "r ou tcriture w\ II attend une donnte en cas de 
lecture et fournit une donnte en cas d'tcriture. L'adresse adr 
traverse la logique de partition LPj, laquelle indique, par le 

25 signal p, si I'adresse adr. appartient k une zone de donndes 
non partagtes (p = 0) ou de donntes partagtes (p = !)• Dans le 
premier cas, la demande est aiguillte vers le processeur de 
gestion PGj et est traitte seinn le mnrfp h o fonctionnement 
dtcrit en rtftrence k la figure 1. Dans le second cas, la 

30 requite est directement aiguillte vers le bus commun BUSA ; le 
bus adresse adr comporte des fils supp 16 mentaires d'adresse » 
permettant d'identifier le mot concerns t I'adresse adr est 
constitute d'une partie adresse bloc adrb et d'une partie f 
adresse mot adrm. Ainsi, apres accord de l'arbitre de bus AB, 

35 la mtmcire centrale RAM regoit soit une demande de transaction 
bloc (p = 0) et dans ce cas, seule la partie bloc adrb de 
I'adresse edr est significative, soit une demande de 
transaction mot (p = 1) et, dans ce cas, toute I'adresse adr 
(bloc adrb et mot adrm) est significative. 

40 [n cas de lecture bloc, ps0etr=0, la 
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porte logique ET6 valide le d<§codeur DECLB qui dSlivre un 
signal de chargement LDj sur le registre a dScalege RDMj, 
permettant de charger dans ce dernier le bloc lu en inSmoire 
5 centrale RAM a l'adresse adrb par le signal de lecture r. 

En cas d'Scriture bloc, p * 0 et w = 0, la 
porte logique ET 5 valide le dScodeur DECEB qui de*livre un 
signal de validation sur le "buffer" BV Jt permettant au 
contenu de ce registre d'etre presents b le me*moire centrale 
10 RAM et d'etre ainsi 6crit a l'adresse adrb, la sortie de la 
porte logique ET 5 fournissant le signal d'6criture bloc. Ce 
dernier est diffuse sur les entries d'Scriture w 1? w it ... aux 
"tranches" mot de la mi§moire centrale RAM a travers les portes 
logiques OUl^. 

15 En cas de lecture mot, p s 1 et r = 0, la 

porte logique ET 3 valide le dScodeur DFCL qui dSlivre un 
signal de validation sur le "buffer" BFS^ permettant au mot 
demande" (d'adresse adrm dans le bloc adrb) dont la lecture est 
assured par le signal 7, d'etre aiguillS vers le bus special 

20 de communication BUSD. Ce mot est r^cup^r^ directement par le 
processeur CPUj sur son entree de donn£e data. 

En cas d'e*criture mot, p = 1 et w = 0, la 
porte logique ETA valide le d<§codeur OECE qui fournit sur sa 
sortie i un signal aiguille a travers la porte logique OU^ 

25 vers l'entrde d'Scriture w i de la "tranche" mot de la m<§moire 
centrale RAM concerned ; ce signal present a l'entr^e w i 
permet d'iScrire dans cette seule "tranche" root le mot fourni 
par le processeur CPUj sur le bus de donnSe BUSD. Le contenu 
de „ce bus est predente' en. purallele sur toutes les "tranches^ 

30 mot de la mdmoire centrale RAM, grace a une activation des 
"buffers" BFE i par le signal issu de la porte logique ET4. 

Une c a r a c t e* r i s t i q u e essentielle de 
l'architecture de l'invention est de presenter une charge 
minimale de requetes sur le bus commun BUSA. Dans 

35 l'architecture schematised a la figure 7, le bus commun BUSA 
est sollicite* par des adresses de bloc et par des adresses de 
mot. La frequence des demandes en adresses de mot est fonction 
du taux de donneds partageds et peut conduire a une saturation 
du bus commun BUSA. 

40 La figure 9 pr£sente en variante une solution 
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pour r^duire cette charge. Le systfeme vis£ comprend, en plus 
des ressources de la figure 7, un bus BUSAM pour les adresses 
de mot, un arbitre A3* pour arbitrer les conflits d'accfes au 
5 bus BUSAM, un arbitre ABM charge d'arbitrer les conflits 
d'accfes en provenance des bus BUSA et BUSAM, et reli6 & un 
multiplexeur MUX lui-m£me relid par see entries aux deux bus 
BUSA et BUSAM. 

Le f onct ionnement de ce systfeme est le 
10 suivant : comme prdcddemment, la logique de partition LPj 
fournit le signal p permettant d'identifier la nature des 
donn^es manipul£es. 

Si la demande concerne des donndes non 
partag£es (p = 0),.tout dSfaut d 'inf or ma t ion entraine une 
15 requfete mgmoire de type bloc qui transite par le bus com nun 
BUSA. 

Si la demande concerne des donnSes partag^es 
(p = 1), la requete est aiguill£e vers le bus commun BUSAM. 
Ainsi, la mdmoire centrale RAM peut recevoir des demandes 

20 simultenSes sur les deux bus BUSA et BUSAM, qui doivent done 
fetre arbitrde6. L'arbitre ABM alloue, de fagon classique, 
l'accfes h la mSmoire centrale RAM & I'une des deux requites et 
reconstitue. le signal p & partir de 1'origine de la demande 
(p s 0 pour BUSA, p s 1 pour BUSAM). Le signal p commands 

25 alors, d'une part, le multiplexeur MUX qui laisse passer les 
signaux du bus concern^ par la requite, d'autre part, la 
logique de d£codage DEC : on se retrouve dans la situation du 
systfeme nr£n6dent. 

On notera que la charge s'est d£plac£e du bus 

30 commun vers la m^moire centrale RAM, puisque le taux de 
requete au niveau de cette derniere reste le meme et que son » 
temps de cycle est du mSme ordre de grandeur ou m£me supdrieur 
h celui du cycle bus. * 
Cette solution n'est done intdresssnte que si 

35 la me'moire centrale RAM est constitu6e de bancs m^moire 
centrale independents organises selon la description donne*e 
plus loin en reference b la figure 20 : plusieurs transactions 
peuvent dans ce cas, si elles affectent diffSrents bancs 
mdmoires, avoir lieu simul tenement. 

40 La figure 10 pre'sente un schema synoptique 
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cPun mode de realisation d'archi tecture conforme a 
l'ir.vention, dans lequel le probleme des donn6ea partagees est 
traite de facon dynamique. A cet effet, le dispositif conforme 
5 a ce mode de realisation comporte un processeur espion de bus 
PEj, couple a un processeur de gestion du lien parallele PGPj. 
Un processeur de gestion du lien aerie PGSj est 116 au 
processeur espion PEj par une file d'attente FIFOj. Un 
processeur de gestion de requetes de l'unite centrale PGUj est 

10 lie, d'une part, au processeur de traitement CPUj, d'autre 
part, aux processeurs de gestion du lien parallele PGPj et de 
gestion du lien s§rie PGS j* La logique correspondent au 
processeur de gestion PGj de cheque me moire-cache est dans ce 
mode de realisation eclatee dans les divers processeurs 

15 presentes ci-dessus. L'acces a la memoi re-cache MCj et a son 
repertoire RG j est regleroente par un processeur de gestion du 
repertoire et du cache PGRj. 

Enfin, un processeur de gestion PGM de la 
memoire centrale RAM est connecte au bus BUSA et a la memoire 

20 centrale RAM , et a ses registres a decalages RDMj . 

Le fonctionnement de 1 1 ensemble est le 

suivant : 

Cheque transaction sur le bus commun BUSA 
correspond a une demande de lecture ou d'ecriture de bloc bi. 

25 Les processeurs espions de bus PEj sont actives par cheque 
demande de lecture de bloc de donnees. Cette operation 
realisee dans le meme cycle par tous les processeurs espions 
va permettre de garentir l'unicite de valeur des donnees 
partagees. Le processeur espion PE j dispose d r un acces au 

30 repertoire RGj. La fonction d'appli cation util isee pour la 
gestion de la m e m o i r e - c a c h e MCj est dans le mode de 
realisation decrit du type application directe. Cheque element 
du repertoire est un descripteur de bloc qui contient un champ 
"tag" (adresse du bloc), des bits classiques d'etats du bloc : 

35 un bit de validation v et un bit de modification m et deux 
bits suppiementaires a pour noter que le bloc est connu de la 
memoire-cache mais encore en cours de transfert sur la liaison 
serie, f pour indiquer que le bloc est dans la file d'attente 
riFO et eviter ainsi qu'il y soit place plusieurs fois. 

40 Le processeur de qestion memoire PGM dispose, 
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d'une part, d'une file d'attente AFIFO d'edresses de blocs bi 
et d'sdresses de processeura, accessible de fa$on associative, 
d'autre part, d'un repertoire d'etat des blocs constitue de 
5 2 bits par bloc ro et rw indiquant les Stats possibles de bloc 
suivant : 

. ro s rw s 0 t bloc non encore diffuse, M 
. ro = 1 ; rw = 0 : bloc dejfc diffuse en 
lecture : une ou plusieurs copies de ce bloc se trouvent dans 
10 les mdmoires-caches, 

ro = 0 ; rw = 1 : bloc diffuse en 
ecriture : la copie & Jour de ce bloc se trouve dans une 
„ mdmoire-cache . 

revolution des bits d'etats de blocs est la 
15 suivante, differente selon la nature de la demande du 
processeur de traitement CPU. : 

- si le processeur CPUj fait une demande de 
lecture de donnees non partag^es (espace programme ou de 
donnees expliciteraent non partag«§es) t le bloc est marque dejfc 

20 diffuse en lecture (ro = 1 ; rw = 0) c&te mgmoire centrale 
lors du transfert dudit bloc de la memoire centrale RAM vers 
le reglstre RDM j et marque non modifie (m s 0) c&te ndmoire- 
cache dans le meme cycle de tnise h jour du repertoire RGj de 
la mdmoire-cache (bloc valide)* Les espions n'ont pas r£agi b 

25 la requite sur le bus commun (la demande ayant ete faite avec 
Vindication "donnees non partagees"). 

- si le processeur CPUj fait une demande de 
lecture de donnees (a priori partagees), le bus commun BUSA 
est occupe pour le temps du pes^ene ■ inf ticns 

30 d'adresses et de type de requ§te, le temps de leur traitement 
par le processeur PGM et les espions du bus commun PEj. En 
memoire centrale RAM, ce bloc peut §tre : * 

1. Non encore diffuse : ro = rw a G, II 
est alors transmis h l'unite centrale UCj et prend l'etat non * 

35 tnodifie, 

2. Dej& diffuse en lecture : ro r 1 ; 
rw s 0. II est alors transmis & l'unite centrale UCj. Son etat 
ne change pas, 

3. Dejfe diffuse en ecriture : ro = 0 ; 
40 rw = 1. La copie h Jour de ce bloc se trouve dans une memoire- 
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cache MCj« Le processeur espion PEj associe a cette memoire- 
cache a note la demande de l'unite centrale UCj lors du 
passage de l'adresse sur le bus commun et a entrepris son 
5 transfert en m^moire centrale RAM des que possible sur sa 
liaison s£rie LSj. En attendant son transfert effectif, le 
processeur de gestion ndmoire PGM met la demande en attente 
dans la file d'attente associative qui comporte un nombre 
d'eiements egal au nombre de processeurs. 

10 Lors de la demande de lecture sur le bus 

commun BUSA, tous les processeurs espions PE. ont rdagi en 
consultant le repertoire RG^ associe a leur memoire-cache MC|. 
Lebus commun BUSA n'est liber e que lorsque tous les 
processeurs espions PE^ ont eu leur acces au repertoire de 

15 gestion RG., ce qui garantit le m§me etat du bloc dans tout le 
systeme. Le processeur qui possfede la copie h Jour dans sa 
memoire-cache effectue dfes que sa liaison serie est libre, le 
transfert de ce bloc dans le registre RDM i et fait une demande 
d'ecriture de bloc sur le bus commun qui aura pour effet de 

20 liberer la demande en attente dans la file associative AFIFO 
et d'effectuer la mise a jour des bits d'etats du bloc. 

Le mise a jour du bloc n'a done necessite 
qu'une ecriture en memoire centrale RAM sans activation 
d 'espion . 

25 - si le processeur CPUj .demande l'ecriture 

d'une donnee dans un bloc present dans sa memoire-cache MCj 
avec l'6tat non modifie, une demande d'ecriture informative 
doit §tre emise sur le bus commun BUSA car il est possible que 
d'autres memoires-cache MC^ possfedent ce bloc avec le mfeme 

30 etat. Ces eutres rr.emoires dcive~t *tre inform^es du changsment 
d'etat. A cet effet, tous les processeurs espions PZ i (actives 
par l'ecriture informative diffusee sur le bus commun BUSA) 
consultent leur repertoire de gestion RG A et invalident ce 
bloc, cependant que le memoire centrale note dans le meme 

35 temps le changement d'etat de ce bloc ainsi que le processeur 
de gestion parallfele PGPj, dans le repertoire de gestion RGj. 
La liberation du bus commun BUSA par tous les processeurs 
espions et la memoire centrale RAM permet au processeur CPUj 
de realiser l'ecriture dans sa memoire-cache MCj, la mise a 

40 jour du bit d'etat du repertoire de gestion RGj ayant ete 
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ef f ectuSe ♦ 

Si une units centrale est en attente d'accfcs 
au bus BUSA pour la meme requete eur le mSme bloc, sa demande 
5 se transforroe en Scriture simple et suit alors le protocole de 
demande de bloc en Scriture. 

- si le processeur CPUj demande l'Scriture 
d'une dbnnSe dans un bloc absent de 1-a raSmoire-cache MC jt ce 
bloc est lu en mSmoire centrale RAM et amenS dans la mSmoire- 
10 cache MCj pour que l'Scriture soit rendue effective. 

En mSmoire centrale RAM, ce bloc peut 6tre : 

1. Non encore diffuse" : ro = rw = o. Le 
bloc est alors Smis sur la liaison sSrie LS, vers la mSmoire- 
cache MCj. II prend les Stats ro = 0 ; rw = 1 en mSmoire 

15 centrale et l'Stat modifiS (m = 1) dans la mSmoire-cache , 

2. DSjfc diffusS en lecture : ro = 1 ; 
rw s 0. Le bloc est Smis sur la liaison sSrie L5 . vers la 
mSmoire-cache MCj. II prend les Stats ro = 0 ; rw = 1 en 
mSmoire centrale et l'Stat modifiS ( m = 1) dans la mSmoire- 

20 cache. Lors de la demande sur le bus commun BUSA, les 
processeurs espions PE £ ont notS la requete et invalids ce 
numSro de bloc dans leur mSmoire-cache MCj, 

3. DSjfc diffusS en Scriture t ro = 0 ; 
rw = 1. La demande est mise dans la file d'attente associative 

25 AFIF0 et le bus commun BUSA est libSrS. 

Le processeur espion PE i de la mSmoire-cache 
MC if dStenteur de la copie h jour, active dhs que possible le 
transfert du bloc demands de sa mSmoire-cache HC i vers la 
mSmoire centrale RAM. Ce bloc est ensuite invalids dans la- 
30 mSmoire-cache MC 



'i' 



L'unitS centrale UCj fait une demande 
d'Scriture de mise h jour de bloc dans les deux cas suivants : 

a) la mSmoire-cache est saturSe et la purge 
d'un bloc nScessite la mise h jour de ce bloc en mSmoire 

35 centrale, 

b) une units centrale UC i est en attente d'un 
bloc dont la seule copie b jour se trouve dans la mSmoire- 
cache MCj. Le processeur espion PE j note le demande et rSalise 
des que possible la purge de ce bloc. 

40 c&t ^ mSmoire centrale RAM, cheque demande 
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d'ecriture de roise h jour entraine une consultation de la file 
d^attente associative AFIFO et, en cas de ddcouverte d'une 
unite centrale UC L en attente de ce bloc, le chargement de ce 
5 bloc dans le registre & decalage RDM i et la miss h jour des 
bits d'etats correspondent h ce bloc. Ce type de detnande 
d'ecriture ne sollicite done pas les processeurs espions. 

Le processeur de gestion du repertoire PCRj 
qui est ajoute dans ce mode de realisation, per met le 
10 deroulement de l'algorithme evoque ci-dessus, _ en coordonnant 
les accfes au repertoire de la me moire-cache MC. qui regoit des 
requ&tes de trois unites f onctionnelles asynchrones : 

1. Le processeur de traitement CPUj, en vue 
de lire les instructions du programme en cours d'executiori et 
15 de lire ou ecrire les donnees manipuiees par ce programme, 

2« Le bus commun BUSA, en vue de maintenir le 
coherence des donnees dans la memoire-cache MCj, 

3. La liaison serie LSj, en vuede 
charger/decharger un bloc d'inf ormat ion de/vers la memoire 
20 centrale RAM. 

Chacune de ces requetes accede au repertoire 
de gestion RGj de la memoire-cache* La serialisation de ces 
accfes sur ledit repertoire de gestion permet d^ssurer le bon 
f one t ionnement de l'algorithme sus-evoqu4.de coherence de 

25 l'inf ormat ion dans les memoires-caches. On obtient ainsi un 
couDlege fort des requdtes au niveau du repertoire de gestion 
RGj mais la synchronisation qui doit exister au niveau du 
traitement de ces requ&tes est suffisamment faible pour 
envisager un f onctionnement asynchrone de la logique de 

SO'traitssent de ces requites, ce qui conduit au decoupag* 
fonctionnel suivant ! 

L'interface de cheque processeur CPU j et de 
ses auxiliaires (PGSj, PGUj) avec le bus commun BUSA est 
compos6e de deux parties ayant un f onctionnement mutuellement 

35 exclusif : le processeur de gestion du lien parallfele PGP j est 
charge de requerir le bus commun BUSA h la demande du 
processeur de gestion de requites PGU j ou du P rocesseur dR 
gestion du lien serie PGSj et de piloter le bus commun BUSA en 
ecriture. Le processeur espion de bus PEj assure la fonction 

40 d'espionnage, ce qui revient h piloter le bus commun BUSA en 
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lecture. II accede de fagon frSquente au repertoire RGj de la 
memoire-cache MCj. 

Le processeup de geetion du lien s^rie PGSj 
5 gere l'interface avec la liaison s£rie I S j • II assure le 
chargement et le dechargement de blocs d 1 informations bi a la 
demande du processeur de gestion de requetes PGU . et du 
processeur espion de bus PEj. II accede de fagon peu frequente 
a la m^noi re-cache MCj et au repertoire de gestion RGj 
10 correspondent* 

Le processeur de gestion de requetes p GUj 
assure le suivi des requetes issues du processeur CPUj. II 
accede de fagon trfcs frequente a la m^moire-cache MCj et au 
repertoire de gestion RG y Cette interface inclut l'eventuelle 

15 logique de "MMU" ("Memory Management Unit") habi tuel lemen t 
associee au processeur de traitement cp Uj. 

Le processeur de gestion PGRj du repertoire 
de gestion RG j est I'arbitre charge d'allouer l'acces a la 
memoire-cache MCj. 

20 Les figures 11, 12, 13, 14, 15, 16 et 17 

representent a titre d'exemples des modes de realisation des 
diverses unites f onctionnelles du dispositif de la figure 10. 
Les designations des signaux ou entrees et sorties des unites 
sont choisies de fe$on habituelle. Les signaux de meme 

25 f onctionnalite qui sont engendrds dans cheque unite 
fonctionnelle a partir d'un signal de base seront designes par 
la mime reference, par exemple : dnp = donnees non partagees, 
d 1 = demande de lecture, maj = mise a jour, de r demande 
d'ecriture, ei s ecriture informative* Le dispositif oossede 

30 plusieurs processeurs et l'indice j utilise jusqu'e present 
visait un processeur courant et ses auxiliaires ; pour alieger 
la description, cet indice a ete omis sur ces figures et il 
est bien entendu que la description qui suit vise chacune des 
unites f onctionnelles qui se rattachent a cheque processeur de 

35 traitement. Par ailleurs, les signaux notes x_YZ definissent 
le nom et l'origine du signal dans le cas ou YZ = RG, MC, UC, 
et la source et la destination du signal dans les autres ces, 
avec Y et Z representent : U = PGU, R = PGR, P = PGP ou PE, 
5 = PGS. 

40 La memoire-cache MC presentee a la figure 11 
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a par example une capacity de 16 K0. Elle est organisSe en 
16 modules de mdmoire vive repide de 1 KCf MCq, ... M Ci5> 
chacun accessible sur un front de 4 octets ; le bus adresse de 
5 la m6moire-cache MC (note* adr_MC) comporte une partie adresse 
de bloc adr_bloc et une partie adresse de mot dans le bloc 
adr_mot. Le bus adresse adr_MC est constituS de 14 fils, 
permettant d'adresser les 16 K{f de la memoir e-cache MC. La 
partie adr_bloc comporte 8 fils permettant d'adresser les 

10 256 emplacements de blocs de la m<Smoire-cache MC f et la partie 
adr_mot 6 fils permettant d'adresser un mot dans le bloc dont 
la taille est dans I'exemple de 64 octets. 

La partie adresse adr_bloc est relive h 
l'entr^e adresse de chacun des modules me'moirea MCq..« MCj£. 

15 La partie adresse mot adr_mot est. relive a I'entre'e de deux 
diScodeurs DECO et DEC1 (seuls les 4 bits de forte poids du bus 
adresse adr^mot sont utilises : l'adresse est une adresse 
octet et le cache a une units d'acces qui est un mot de 
4 octets). Le signal de lecture T_MC est ddlivre* h chacune des 

20 entries de lecture des modules m£moires MCq... MCj^ et & I'une 
des entries d'une porte logique 0U1. L'autre entree de cette 
porte logique 0U1 regoit le signal bloc inverse'. Le signal 
d'dcriture w_MC est d61ivr6 & l'une des deux entries de portes 
logiques 0U2 et 0U3. La porte loqique 0U2 regoit sur son autre 

25 entree le signal bloc inverse. La porte loqique 0U3 regoit sur 
son autre entree le signal bloc. La sortie de la porte logique 
0U1 est relive h l'entr^e de validation enl du dScodeur DEC1, 
et la sortie de rang i de ce dScodeur DEC1 active un "buffer" 
de validation BVL de rang i. La sortie de la porte logique 0U2 

30 est relive h Pentree de validation enO du dScodeur DECO et h 
des "buffers" de validation 3 VZ. La tiOiLie tie la pai-te logique 
0U3 est reliee h des portes logiques ETIq*** ET1j 5 , qui 
regoivent sur leur autre entree la sortie de rang 
corr espondan t du d€codeur DECO. La sortie i de cheque porte 

35 logique ET1 Q ... ET1 15 est relive h I'entre'e d'e'criture 
wj... de chaque module mdmoire MCq... MC i5 . Un bus de 

donn6e relie chaque module m6moire MCq... MC i5 & l'un des 
buffers de validation BVL et h l ! un des buffers de validation 
BVE. La sortie des buffers RVL et l*entr6e des buffers BVE 

40 regoivent en parallele un bus de donn^e datamot_MC (reli§ au 
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processeur de gestion des requStes PGU). 

Le fonctionnement de l'exeraple de la mSmoire- 
cache ci-dessus dScrit est le suivant : 

5 

Cas 1 

La demande provient du processeur de gestion 
du lien sSrie PCS. Ce cas est signals par la presence d'un 
Stat logique z^ro sur le signal bloc* 

10 En lecture mSmoire-cache, le processeur de 

gestion du lien sSrie PGS prSsente sur le bus adresse adr_ MC 
l'adresse de 1 1 em p 1 acem en t de bloc b lire (dans ce cas, seule 
la partie adr_bloc du bus adr_MC est utilisSe) et active le 
signal de lecture r_MC. A l'issue des temps d'acces, le bloc 

15 est disponible sur le bus datebloc_MC. 

En Scriture m Smcire-cache, le processeur de 
gestion du lien sSrie prSsente sur le bus adresse adr_MC 
l'adresse de l'emplacement du bloc b Scrire, sur le bus de 
donnSe databloc_MC la donnSe b y inscrire, et active la ligne 

20 w_MC. L'Stat zSro du signal bloc aiguille le signal w_MC vers 
les entrSes de commands d'Scriture des modules de la mdmoire- 
ceche MCg... MC25, via les portes logiques QU3 et ETlj. 
L'inf ormation prdsente sur le bus de donn^e databloc_MC est 
inscrite en mSmoire-cache b 1'issue du temps d'Scriture. 

25 Cas 2 

La demande provient du processeur de gestion 
de requite PGU du processeur de traitement CPU. Ce cas est 
signal^ par la presence d'un Stat logique un sur le signal 
bloc. 

3° En lecture mSmoire-cache, le processeur de 

gestion PGU prSsente sur le bus adr_MC l'adresse du mot 
demands, et active le signal de lecture 7_MC. Le bloc 
correspondent b la partie adr_bloc est lu en mS moire-cache, et 
le. mot demands est aiguillS, via l'un des buffers de 

35 validation BVL, vers le bus de donnSe datamot_MC. Le buffer de 
validation BVL concerns est activS par la sortie du dScodeur 
DEC1 correspondent b l'adresse mot adr_mot demandSe. 

En Scriture m S mo i re-cache , le processeur de 
gestion PGU prSsente sur le bus adr_MC l'adresse du mot b 

40 Scrire, sur le bus de donnSes datamot_MC la donnSe b Scrire, 
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et active le signal d'ecriture w_ MC. La donn^e presente aur le 
bus datamot_MC est diffusde sur chaque module me* moire-cache , 
via les buffers BVE validSs par le signal d'ecriture. Le 
5 signal d'ecri ture w_ MC est ensuite presente au seul module 
memoire concern^. II est deiivre a la sortie du decodeur DECO 
cor respondent a I'adresse adr_mot concern^. 

Dans le mode de realisation ci-dessus decrit, 
les problemes d'acces en octet et double octet, et d ( acces en 

10 double octet et mot a cheval sur deux modules m£moires sont 
rdsolus de la m3me fecon que dans les systemes inf ormatiques 
t raditionnels et ne sont pas d£crits ici. 

Les figures 12a, 12b, 12c, 12d presentent, a 
titre d'exemple, les ca r ac t 6r i 8 t iques d'un repertoire de 

15 gestion du cache RG et d'un processeur de gestion associe* PGR. 
La figure 12a illustre la structure logique de I'adresse 
adr_RG dans I'hypothese d'un espace d'adressage sur 32 bits et 
avec les caracteristiques de la mgmoire-cache ddcri.te 
pr^c6demmen t. Le champ -tag-, composante de I'adresse bloc, 

20 est code sur 18 bits* Le champ -cadre- est code sur 8 bits et 
permet d'adresser les 256 emplacements de bloc de la memoire- 
cache MC. Les 6 derniers bits definissent I'adresse mot dans 
le bloc, en unite octet. 

La figure 12b presente la structure du 

25 repertoire de gestion du cache RG, qui est une simple memoire 
rapide vive de 256 mots de 22 bits. Chaque mot d'adresse i 
contient le descripteur du bloc inscrit dans l'emplacement i 
de la memoire-cache . 

La figure 12c schematise la structure du 

30 descripteur qui oomporte t . - ■ -. 

- un champ tag de 18 bits, definissant 
I'adresse du bloc dans l'emplacement ou cadre de bloc courant, 

- le bit de validation v, 

- le bit de modification m, 

35 - le bit d'attente de fin de transfert a, 

- le bit d'sttente de purge f. 

La figure 12d four nit la structure du 
processeur PGR, qui n'est autre qu'un arbitre classique avec 
priorite fixe. 

40 Cet arbitre comprend un reqistre LATCH, dont 
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trots entries recoivent respec t i vement des signaux rqst_UR, 
rqs*t_PR, rqsl_SR, egalement deiivres respecti veraent vers des 
portes logiques ET2, ET3, ET4. Les sorties correspondantes du 
5 registre LATCH sont relives aux entries d'un encodeur de 
priority PRI, dont les sorties sont relives aux entries d'un 
ddcodeur DECPRI. Les sorties de rang correspondent h ceux du ^ 
registre LATCH sont relives aux signaux grnt_UR f grnt_PR, 
grn t_SR ainsi que, de fagon inversee, respecti vement aux 
10 entries des portes logiques ET2, ET3, ET4. Les sorties des 
portes logiques ET2, ET3, ET4 sont relives aux entries de la 
porte logique N0U1. La sortie de la porte logique N0U1 est 
relive h une bascule Bl, qui regoit sur son entree D la sortie 
eO de I'encodeur de priority PRI. L'ensemble du" dispositif est 
15 synchronise par une horloge g^ndrale qui deiivre un signal h h 
l'une des entries elk d'une porte logique ET5 et, de fa$on 
inversee, sur l'entr^e horloge de la bascule Bl. La sortie Q 
de la bascule Bl est relide & l'autre entree de la porte 
logique ET5. La sortie de la porte logique ET5 est relive h 
20 TentrSe load du registre LATCH. 

Le f onctionnemen t de cet arbitre est le 
suivant : en l'absence de toute requfete sur les lignes rqst, 
la bascule Bl memorise en permanence l'etat de le ligne eO, 
inactive, et valide ainsi h travers la porte logique ET5 le 
25 charqement du registre LATCH. 

L'arrivee d'un signal rqst provoque le 
verrouillage de l'horloge et l'ectivation du signal grnt 
associe au signal rqst, jusqu'fc desact iva t ion de ce dernier i 
1'arbitre est fige dans son Stat pendant toute la durdi c's lo, 
30 transaction en c ours. 

Le processeur de gestion des requetes PGU, 
represents h la figure 13, constitue une interface entre le « 
processeur de traitement CPU et : 

- d'une part, les divers processeurs avec * 
35 lesquels il doit ^changer des informations : processeur de 

gestion parall&le PGP, processeur de gestion s£rie PCS, 
processeur de gestion du repertoire du cache PCR, 

- d'autre part, le repertoire de gestion de 
la memoir e-cache RG et la memoire-cache MC. 

40 Le processeur de traitement CPU declenche 
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l'activite du processeur de gestion des requites PCU en 
activant le signal al ("address strobe"). Ce signal valide le 
bus adresse adr_CPU, les signaux de lecture r_CPU et 
5 d'ecriture w_CPU ainsi que les lignes fonction fc_CPU du 
processeur de traitement CPU. Le processeur de traitement CPU 
se met alors en attente jusqu'a acquirement de la requite par 

le signal dtack_CPU. 

Le signal as est relie a l'entree d«un 
10 circuit dif ferenciateur D10. La sortie de ce circuit est 
connectee a l'une des trois entrees d'une porte logique ET12, 
les deux autres entrees recevant respecti vement des signaux 
aTk_US et acT<_UP. Ce dernier signal est egalement d^livre a 
l'entree "r d'une bascule B13. L'entree "s de la bascule B13 
15 recoit la sortie d'une porte logique NET10. La sortie de la 
porte logique ET12 est reliee 6 l'entree S d'une bascu le Bll, 
a l'entree S* de la bascule BIO et a ljentree clearlO d'un 
registre a decalages SR10. La sortie Q de la bascule Bll 
fournit le signal rqs~t_UR. La bascule Bll recoit sur son 
20 entree R la phase 013 inversee et la bascule B10 la phase 011 
inversee. La sortie Q de la bascule B10 est reliee a l'entree 
serie serial_inl0 du registre SR10. Le registre a decalage 
SR10 regoit sur son entree clklO le sig nal h orloge -h- et sur 
son entrde de validation enlO le signal grnt_UR. 

25 L'activation du signal as declenche le 

fonctionnement du circuit de dif ferenciation D10. L'impulsion 
produite par ce circuit traverse la porte logique ET12, metj» 
l'etat logique un les bascules B10 et Bll par leur entree S, 
et effectue egalement la remise a zero du registre a decalage 

30 SR10 par son entree cleariU. 

La bascule BIO et le registre & decalsge SR10 
constituent le sous-ensemble logique "distributeur de phases" 
DP_U. L'activation de ce distributeur de phases est d«*clenchee 
par la mise a un de la bascule B10 et la remise a zero du 

35 registre a decalage SR10. Si le registre a ddcalage est valide 
par la presence d'un niveau zero sur son entree enlO, alors la 
prochaine impulsion d'horloge h sur l'entree elk du registre a 
decalage produit le decalage d'un pas dudit registre. 

L'etat logique un de la bascule B.10 est 

40 repercute sur la sortie 011 du registre a decalage SR10 par 
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son entree s6rie serialinlO. La sortie Oil, appelSe phase Oil, 
inversee, remet la bascule BIO a zero par son entree R. Ainsi, 
un bit unique est introduit dans le registre a dScalages SR10 
5 a cheque activation du distributeur de phases DP_U. A chaque 
impulsion d'horloge h, ce bit va se deceler dans le registre a 
decalage SR10 et produire les phases consScutives disjointes 
©11, &12, &13. 

La mise a l»6tat logique un de la bascule Bll 
10 provoque I'activation du signal rqst_UR. Ce signal est emis a * 
destination du processeur de gestion du repertoire PGR. Ce 
dernier, des que possible, va accorder l'ecces au repertoire 
de gestion RG et a la memoire-cache MC en activant le signal 
*grn"t_UR, qui va valider l'ensemble des buffers de passage 
15 BV10, BY11 et BV12 situSs respecti vement sur les bus du 
repertoire de gestion et but les bus de la memo ire-cache . Ce 
signal grrvt_UR valide egalement le distributeur de phases qui 
va done produire se*quentiellement les phases Oil, 012, 013. 

La phase 011 correspond a une temporisat ion 
20 permettant de lire le descripteur du bloc demand^ par le 
processeur de traitement CPU dans le repertoire de gestion RG, 
adresse* par le champ cadre de I'edresse adr_CPU et relie au 
bus adr_RG a travers des buffers de passage BV10. Le signal 
r_RG est toujours actif a l^ntree d'un buffer BV10, le signal 
25 w_RG toujours inactif a l'entrtie d'un buffer BV10. A l'issue 
de la temporisation, le descripteur est retourne* au processeur 
PGU via le bus data_RG. La partie tag de ce descripteur et le 
bit de validation v sont deiivres a l'une des entries de 
comparaison d'un comparateur C0MP10, 1'autre entree ften.t 
30 relieve a la partie tag de l'adresse adr_CPU. Le bit en regard 
du bit de validation v est toujours a un, Le comparateur 
C0MP10 est valide en permanence par la presence d'un niveau un , 
sur son entree enll. 

Temps d'acces au repertoire de gestion RG et $ 
35 frequence d'borloge h sont en rapport tel, qu'a la fin de la 
phase 911, la sortie eglO du comparateur COMP10 est 
positionnee et fournit 1 1 i n f o r m a t i on "le bloc demand^ est 
present dans la memoire-cache ou absent de la memoire-cache". 

Si le bloc demande est present dans la 
40 memoire-cache MC (eglO = 1) alors le signal eglO, deiivre b 
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1'une des deux entrees de Is porte logique ET10, fournit un 
signal calibre par la phase 812, presente sur 1-autre entree 

de la porte logique ET10. 
5 ce signal calibrd present sur la sortie de la 

porte logique ET10, est relie aux entrees des portes logiques 

NET10, NET11, NET12. 

La porte logique NET10 regoit sur aes 

entrees, outre la sortie de la porte logique ET10, le bit 

10 inverse d'etat m issu du descripteur, et le signal inverse de 

demande d'6criture V_CPU. 

L'activation de la porte logique NET10 

correspond a l'etat "demande d'ecriture d'un mot dans un bloc 
present dans le cache et qui n'a pas encore ete modifie 
15 (m = 0)". La sortie de la porte logique NET10 est reliee k 
l'entree T d'une bascule D13. L'activation de la porte logique 
NET10 met la bascule B13 dans l'etat logique un, ce qui 
declenche une requete d'ecriture informative par la ligne 
Fo"st_UP au processeur de geetion du lien parallfele PGP. 
20 L'adresse du bloc- concerne eot fournie per les lignes 
adr_bloc_UP, derive des lignes adr_CPU. 

Le processeur de gestion des requites PGU a 
terminc* la premiere psrtie de sa t&che : le repertoire de 
gestion RG et la memoi re-cache sont liberes par deactivation 
25 du signal 7qTt_UR, consequence de l'errivde de la phase &13 
inversee sur l'entree *R de la bascule Bll. 

Le mecanieme de l'ecriture informative est 
decrit au paragraphe "processeur de gestion du lien parallfele 
PGP", et a pour effet de mettre le bloc demande dens l'dtat 
3G aodifie (a s 1) ou invalide (v s.9). . On notera que. J a 
liberation du repertoire de gestion RG et de la memoire-ceche 
MC par le processeur de gestion des requfetes PGU est 
n^cesaaire afin que le processeur de gestion du lien parallfele 
PGP puiase y avoir accfes. Le fin de l'operation "ecriture 
35 informative" est signalee au processeur- de gestion des 
requetes PGU per l'activation du siqnal ack_UP, qui a pour 
effet de remettre & rero la bascule B13 et d'activer, k 
travers la porte logique ET12, la bascule Bll et le 
distributeur de phases : le cycle in i t i a lem e n t lance par le 
40 signal se reproduit, mais la sequence consequence de 
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1'actlvation de la porte NET10 ne se reproduira pas une 
seconds fois dans ce cycle de requite. 

La porte logique NET11 recoit sur sea 
5 entries, outre la sortie de la porte logique ET10, le bit 
d'etat id issu du descripteur, et le signal inverse" de demande 

d'ecriture w"_CPU. . 

L'activation de la porte NET11 correspond a 
1'etat "demande d^criture dans un bloc present dans le cache 

10 et qui a d$ja ete modifie". 

La sortie de la porte NET11 est relive, a 
travera un des buffers BV11, au signal d'ecriture w_MC de la 
mSmoire-cache MC. Ce signal permet d f e*crire dans la mSmoire- 
cache, a l'adresse presente sur le bus adr_MC, relie au bus 

15 adr_CPU, via les buffers BV11, la donn6e presente sur le bus 
data_MC, relie au bus data_CPU via les buffers bidirectionnels 
BV12. Le sens d'activation de ces buffers est fourni par le 
signal w_MC. 

La sortie de la porte NET11 est egalement 
20 relive a l'une des entries de la porte logique ET11, qui 
renvoie ainsi le signal dtack_CPU au procesaeur de traitement 
CPU. L'op^ration d'ecriture dans le cache se fait en parallele 
avec Tectivation du signal dtack_CPU, ce qui est conforme aux 
specifications habituelles des processeurs de traitement. 
25 L'operation se termine par la liberation du 

repertoire de qestidn RG et de la me* moire-cache MC par 
desactivation du signal rqst_UR, consequence de l'arrivee de 
la phase 613 inversee sur la bascule Bll. 

La porte logique NETT2 reccit s-r 
30 entries, outre la sortie de la porte logique ET10, le signal 
inverse de demande de lecture TcPU. L'activation de la porte 
logique NET12 correspond a I'etat "demande de lecture d'un mot ? 
dans un bloc present dens le cache". 

La suite des operations est identique a « 
35 I'operation precedente, a la seule difference du signal active 
(7_MC plut6t que TT_MC) associe au sens de transit des donnees 
sur les bus data_CPU et data_MC. 

5i le bloc demande est absent de la memcire- 
cache (eglO = 0), alors le signal eglO, inverse, relie a l'une 
40 des deux entrees de la porte logique NET13, fournit un signal 
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calibre par la phase 012, presente sur I'.utr. entree da la 
porte logique NET13. La sortie de la porte logique NET13 est 
reliee a l'entree S de la bascule B12. Ce signal calibre force 

5 la bascule B12 a un, ce qui a pour effet d'emettre une requite 
de service rqst.US vers le processeur de gestion du lien serie 
PCS. Ce processeur recoit egalement l'adresse du bloc a 
requerir sur les lignes adr_bloc_US et la nature de la requite 
sur les lignes w_US, r_US et fc_US. 

10 Le processeur de gestion des requites PGU a 

termine la premiere partie de sa tache . le repertoire de 
gestion RG et la m e m o i r e- c a c he MC aont liberes par 
deactivation de la ligne rqst_UR, consequence de l'arrivee de 
la phase 013 inversde sur la bascule Bll. 

15 Le mecanisme de raise a jour du cache eat 

decrit au paragraphe "processeur de gestion de la liaison- 
serie PGS" . 

On notera que la liberation du repertoire de 
gestion RG et de le me moire-cache MC est necessaire pour que 
20 le processeur de gestion de la liaison serie PGS puisse y 
avoir acces. 

La mise a jour du cache est signalee au 
processeur de requite PGU par l'activation du signal ack_US. 
Ce signal est delivre a l'entree R de la bascule B12 et h 

25 l'entree de la porte ET12. II e ainsi pour effet de remettre a 
zero le bascule 812 et d'activer b travers la porte loqique 
ET12, la bascule Bll et le ■ distributee de phases : le cycle 
initialement lance par le signal a! se reproduit, mais cette 
fois avec succes du feit de la presence du bloc dans la 

30 roemoi'fe-'c'ache*." 

Le processeur de gestion serie PGS represente 
b titre d'exemple a la figure 14 est charge de gerer la 
liaison serie LS et a ce titre de realiser les demandes de 
transfert de blocs entre memoire centrale RAM et memoire-cache 

35 MC et de realiser les mises b jour corr espondantes dans le 
repertoire de gestion RG. II traite en priorite les demandes 
issues du processeur espion PE en attent.e dans une file 
d'attente FIFO. II traite egalement les demandes issues du 
processeur de requites PGU. 

40 Ce processeur de gestion de la liaison s6rie 
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PGS comprend une bascule B20 qui revolt sur son entree de 
donn6e D le signal empty issu_de la file d'attente FIFO et sur 
son entree horloge la sortie Q d'une bascule B22. Une bascule 
5 B21 regoit sur son entree de donnde la sortie d'une porte 
logique 0U20. Cette porte logique 0U20 valide le signal 
rqTt_US, regu h I'une de see deux entries, 1'autre entree « 
Stent relive au signal empty. UentrSe horloge de la bascule 
B21 provient de la sortie 0 de la bascule B22. La sortie Q de p 
10 la bascule B22 est rebouclSe sur son entrie de donnSe D, ce 
qui la conditionne en diviseur par deux. L'entrSe d'horloge de 
la bascule B22 est connectSe & la sortie d'une porte logique 
ET20, laquelle regoit sur l'une de ses entries l'horloge 
ggn^rale de f one tionnement h et sur l'autre entrde un signal 
15 de validation. Ce signal de validation provient de la sortie 
d'une porte logique ET24, qui regoit respect ivement sur ses 
deux entries les sorties Q et Q des bascules B20 et B21. 

La bascule B20 regoit sur son entrde R la 
phase 925, inversSe, issue d f un distributeur de phases DP_5. 
20 La bascule B21 regoit sur son enttie "S la sortie d'une porte 
logique N0U2Q. Cette porte logique N0U20 regoit sur ses deux 
entries les sorties respectives de portes logiques ET22 et 
ET23. La porte logique ET22 regoit sur ses entries la phase 
825 issue du distributeur de phases et le signal maj issu 
25 d'une porte logique ET29. La porte logique ET23 regoit sur ses 
entries la phase 927 issue du distributeur de phases et le 
signal maj inverse. 

L'ensemble des circuits B20, B21, B22, ET20, 
ET22, ET23, 0U20, ET24, N0U20 constitue un arbitre &- priority ; 
30 fixe ARB_S. Son f onct ionnemen t est le suivant : la bascule B22 
fournit sur ses sorties U et Q des siqnaux alternds de 
frequence moitid de celle de l'horloge gdndrale. Ces signaux * 
valident al t erna tivement les bascules B20 et B21. Si une 
requfete de service est prSsente sur l'une des entries des ? 
35 bascules B20 ou B21, alors ces signaux elternels mdmorisent la 
demande dans la bascule correspondante (B20 pour le processeur 
espion PE, B21 pour le processeur de gestion de requite PGU) 
qui, en retour, verrouille le f one t i onnemen t alternS. On 
notera que le signal rqTt_U5 en provenance du processeur de 
40 gestion de requites PGU est conditionnS parole signal empty b 
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travers la parte OUZO s ce signal n'est ainal pris en compte 
que si le file d'attente FIFO est vide. La bascule B20 . 
(respectivement B21) n'est remise a zero que lorsque la 

5 transaction a effectuer est terminee. 

L'echantillonnage d'une demande sur Tune ou 
l'autre des bascules B20 et B21 se treduit par un changement 
d'etat de la sortie de le porte logique ET24. La sortie de la 
porte logique ET24 est egalement reliee a un circuit 

10 differenciateur D20 qui delivre une impulsion lors du 
changement d'etat de la sortie de la porte logique ET.24. La 
sortie du circuit differenciateur est reliee d'une pert au 
distributeur de phases DP_S (entree S d'une bascule B36 et 
cT720 d'un registre a decalege SR20) du processeur de gestion 

15 de la liaison-serie et d'autre part a l'une des deux entrees 
de la porte logique 0U22. La sortie de la porte logique est 
reliee aux entrees 1 de deux_bascules B24 et B25. La bascule 
B24 regoit sur son entrSe R la sortie d'une porte logique 
N0U21 et la bascule B25 le signal grnt.SR. La porta logique 

20 N0U21 regoit sur ses deux entrees les sorties de portes 
logiques ET36 et ET37. La porte logique E36 regoit sur ses 
entrees la phase 023 issue du distributeur de phases et le 
signal maj, et la porte logique E37 la phase B27 issue du 
distributeur de phases et le signal maj inverse. 

25 L'impulsion issue du circuit differenciateur 

D20 initialise ainsi le distributeur de phases et met a l'etat 
logique un lea bascules B24 et B25 a travers la porte 
logique 0U22. 

Le distributeur de phases DP_S est constitue 
30 du registre a d e c a 1 a g e s SR 2 0 et de la bascule B36. Son 
fonctionnement est identique a celui decrit dans le paraqraphe 
concernant le processeur dejestion de requites PGU. 

La sortie Q de la bascule B24 est reliee au 
signal 7qTt_SR, a destination du processeur de gestion du 
35 repertoire PGR. Son activation declenche une demande de 
service a ce processeur, qui r£pond par la liqne gr7Tt_SR, 
reliee a l'entree R de la bascule B25. La sortie 0 de la 
bascule B25 est reliee * l'une des entrees d'une porte 
logique 0U23. La sortie de la porte logique 01123 est reliee a 
40 l'entree en20 du registre h dScalages 5R20. 
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L'ensemble logique B24 et B25 constitue une 
logique de resynchronisation RESYNC_S entre unites 
asynchrones. Son f onctionnement est le sulva nt : 
3 Une demande de service rqst_SR vers ie 

processeur de gestion du repertoire PGR se fait par 
activation des bascules B24 et B25 h travers la porte logique 
0U22, ce qui autorise deux origines d'activations. La logique 
propre au processeur de gestion du repertoire PGR assure une 
10 reponse grnt_SR dans un temps indetermine, qui remet b z6ro la 
bascule B25. La bascule B24 maintient sa demande jusqu'fc sa 
remise a zero par activation de son entree R. En retour, le 
processeur de gestion du repertoire PGR d6sactive sa ligne 
gr n t_SR : la logique de resy nchron i sa t i on est prfete b 
15 fonctionner pour une prochaine demande de service. La sortie Q 
de la bascule B25 sert b bloquer le distributeur de phases par 
action sur son entree eTTo via la porte logique 0U23 : la 
remise b zero de la bascule B25 libfere le distributeur de 
phases qui fournira la premifere phase 621 lors de la prochaine 
20 transition active de l'horloge generale h, connects b 
I'entrSe clk20 du distributeur de phases. 

La liqne grnt_SR est eqalement relive aux 
buffers de validation BV20, BV25 et BV21, BV22 qui ouvrent 
l'accfes respecti vement au repertoire de gestion RG et b la 
25 memoire-ceche MC. 

Si la bascule B20 est active, alors la 
transaction en cours est une purge de bloc demandee par le^ 
processeur espion PE via la file d'attente FIFO. La sortie Q 
de Ifl bascule B20 est reliee b des buffers de validation BV24. 

30 Ces buffers regoivent sur leur entree la sortie d'un registre 
REG20. La sortie 0* de la bascule B20 est reliee b l'une des 
deux entrees d'une porte logique 0U21, qui recoit sur son ^ 
autre entree la sortie du circuit d i f f erenci a teur D 20. La 
sortie de la porte logique 0U21 est re liee 6 l'entrSe load20 . 

35 du registre REG20 et b l'entree read20 de la file d'attente 
FIFO. 

Ainsi, 1' activation de la bascule B20 

provoque : 

1, ['initialisation du distributeur de 

40 phases, 
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2. Une demande d'accfes au repertoire de 
qestion RG et a la memoir e-cache MC, 

3. Le chargement de l'element en tete de la 
5 file d'attente FIFO dans le registre REG20 et 1'avance de la 

file d'attente, 

4. Le validation du buffer BV24 : le bus 
adr_X contient l'adresse du bloc a purger. La nature de 
1. operation (miae a jour) sera retrouvee a partir de la 

10 combinaison des bits v et m (aiqnal maj). 

Si la bascule B21 est active, alors la 
transaction en cours provient d*un defaut d< information dans 
la memoire-cache MC. La sortie Q de la bascule B21 est relies 
a des buffers de validation BV23. Cea buffers regoivent sur 

15 leur entree les informations en provenance du processeur de 

gestion de requfete PGU. 

Ainsi l'BCtivation de la bascule B21 

provoque : 

1. ^initialisation du distributeur de 

20 phases, 

2. Une demande d'acces au repertoire de 

gestion RG et a la mtSmoire-cache MC, 

3. La validation des buffers BV23 : le bus 
adr_X contient l'adresse du bloc qui a provoque le defaut 

25 d'information dans la memoire-cache MC, et la nature de la 
requete : lecture ou ecriture, donnees psrtagees ou non 

pertagSes (lignes fc_US) . 

Le champ "cadre" du bus adr_X est relie aux 
lignes d'adresses adr_RG du repertoire de gestJLon RG a travers 

30 des buffers da validation BV20. Leo sorties 5J 3 bnsc^le *** 
et B27 sont respectivement reliees aux lignes r_RG et w_RG du 
repertoire de gestion a travers les buffers de validation 
BV20. La bascule B26 regoit sur son entree 5 la sortie de la 
porte loglque 0U22 et sur son entree R la phase 022 inversee 

35 issue du distributeur de phases. La bascule B27 regoit sur son 
entree S la sortie d'une porte logique N0U22 et sur son entree 
7 la sortie d'une porte logique NOU23. La porte logique N0U22 
regoit sur ses deux entrees les sorties respectives de portes 
logiques ET25 et ET26, elles--n6.es recevant sur leurs entrees, 

40 pour is porte ET25 la phase 022 et le siqnal maj et pour la - 
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porte ET26 la phase 026 et le signal naj. La porte logique 
N0U23 revolt sur ses deux entries lee sorties respectives de 
portes logiques ET27 et ET28, elles-m&mes recevant sur leurs 
5 entries, pour la porte ET27 la phase 023 et le signal maj 
inverse et pour la porte ET28 la phase 827 et le signal roaj 

inverse. ? 

Le champ tag du bus adrjX est relie au champ 
tag dee lignes date_RG b travers des buffers de validation 
10 BV25. Ces derniers recoivent sur leur entree de validation la 
sortie d'une porte logique 0U24 qui recoit sur ses entries le 
signal grnt_SR et la sortie Q* de la bascule 827. 

Les entries D de bascules B28 et B29 sont 
respectivement relives aux lignes bit de validation v et bit 
15 de modification m du bus data_RG. Les entries horloges de ces 
bascules B28 et B29 sont relives b la phase 022 du 
distrihuteur de phases. La sortie Q de la bascule B28 et la 
sortie Q de la bascule B29 sont relives aux deux entries d'une 
porte logique ET29, qui fournit sur sa sortie le signal maj. 
20 Une porte logique 0U25 recoit sur ses entries le signal maj et 
la sortie "q d'une bascule B30. La sortie de la porte 
logique 0U25 est relive b I'entr^e de selection sel20 d'un 
multiplexeur MUX20, qui recoit sur ses deux entries de donnSes 
la sortie Q de la bascule B28 (bit v) et la constante 0, la 
25 constante zero etant choisie lorsque l'entree de selection 
se!20 est b l'etat logique un. La sortie du multiplexeur MUX20 
est relive b la ligne bit de validation v du bus adr_X. La 
ligne bit d'attente -a- du bus adr_X est forc<5e b l'etat 
logique zero, L« bit de modification -m- est relie fele ligne 
30 de lecture 7_ adr_x du bus adr_X. 

L'ensemble logique decrit ci-dessus constitue 
la logique d'accfes et de mise b jour du repertoire de gestion * 
RG. Son fonctionnement est le suivant : l'activation du signal 
"jJ7nt_SR, autorisant 1'accfcs au repertoire de gestion et b la ^ 
35 memoire-cache, valide les buffers de validation BV20. La 
lecture du descripteur concern^ est commandee du debut de 
l'autorisation d'eccfes jusqu'fe I'arrivee de la phase 022, 
instant de memorisation des bits -v- et -m- dans les bascules 
B28 et B29. L'etat combine de ces deux bits produit, b travers 
40 la porte logique ET29, le signal maj qui conditionne la suite 
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des operations. 

lev cas s maj = 1. Ce cas se produit lorsque le bit de 
validation est egal a 1 et le bit de modification est egal 
5 a 1. Ce cas correspond soit ■ une demande de purge de bloc du 
processes espion PE, soit a un defaut d'inf ormation constate 
par le processeur de gestion de requetes PGU sur un 
emplacement de bloc occupe et modifie . dans les deux cas, le 
bloc concerne doit etre ecrit en memoire centrale RAM. 
10 a cet effet, le champ -cadre- du bus adr_X 

est relie aux lignes adr_MC via les buffers de vslidation 
BV21. Les sorties Q des bascules _B 3 0 et B31 sent 
respectivement reliees aux lignes 7jC et w_MC de la memoire- 
cache MC, a travers les buffers de validation BV21. La ligne 
15 bTTc" est forcee a zero via un des buffers de validation BV21. 
Les lignes de donnees data_MC de la me n o i r e-c ac he sont 
reliees, via les buffers de validation bi-di rectionnels BV22, 
aux entrees du registre a decalage RDP et aux sorties des 
buffers de validation BV26, qui recoivent sur leurs entrees 
20 les liqnes de sortie du registre a decalage RDP. Les buffers 
BV22 sont valides par la ligne grnt_SR, et leur sens de 
validation commande par la sortie J de la bascule B31. La 
bascule B30 recoit sur ses entrees S et R respectivement les 
phases 821 et 023, inversees, en provenance du distributeur de 
25 phases. La bascule B31 recoit sur ses entrees S et R 
respectivement les sorties de portes loqiques ET32 et ET33. La 
porte logique ET32 recoit sur ses entrees la phsse 026 et le 
signal maj inverse, la porte logique ET33 la phase 027 et le 
signal maj inverse. Une porte logique NET20 recoit sur ses 
30 entrees la phase 023 et le signal maj. La sortie d'une oorte 
logique ET35 commande les buffers de validation BV26, et 
recoit sur aea deux entrees respectivement le signal maj 
inverse et la sortie 0 de la bascule B 31. La sortie de la 
porte logique NET20 est relije au signal load21 du registre a 
35 decalage RDP et a l'entree 5 d'une bascule B32. L'ent ree R de 
cette bascule B32 recoit le signal f in_transf ert_ma j issu de 
la logique TFR associee au registre a decalage RDP. La sortie 
0 de Is bsscule B32 est reliee h l'une des entrees de la porte 
logique 0U23. 

40 La logique decrite ci-dessus permet de purqer 
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un bloc de la m 6 m o i re-cache . Son f onct ionnement est le 
sulvant : 

En parallele avec l'ecces au repertoire de 
5 qestion RG , une lecture de la m^moire-cache MC est activee par 
la ligne 7_MC f issue de la bascule B30, durant les phases 621 
et 622. A l'iesue de cette lecture, les donnees lu^s, * 
repr£sentant le bloc a dScharger, sont presentee a I'entrSe du 
registre a decalage ROM. L'activation du signal maj, dont ? 
10 l'Stat est connu en debut de la phase 822, provoque : 

1. L'invalidation du bloc dans le repertoire 
de gestion : I'entrSe sel20 du mul tiplexeur MUX20 £tant a 
I'etat logique un, la valeur zero est forces sur le bit de 
validation, le descripteur etent ecrit dans le repertoire de 

15 gestion RG avec I'activation du signal "vTRG, command^ par la 
bascule B27 durant le cycle 922, 

2. Le chargement du registre a decalage RDM 
et I'activation du transfert, lors du passage de la phase 622 
a la phase 623, 

20 3. La mise h l'etat logique un de la bascule 

B32, qui va bloquer le distributeur de phases sur la phase 823 
jusq u'a la fin du transfert, signaled par le signal 
f in_transf ert_maj issu de la logique TFR, 

4. La liberation du repertoire de gestion RG 

25 et de la memoire-cache MC par remise a zero de la hascule B24 
sur le phase 623. 

Ainsi, l'acces au repertoire est libere (done 
accessible pour le processeur espion PE), le transfert de mise 
a jour est en cours, et le distributeur de phases bloquS 
30 sur 823. 

Des que le transfert est terming, le bloc est 
en attente dans le registre a decalage RDM et il f aut activer 
le processeur de gestion du lien parallele pour que l'ecriture 
en memoire centrale RAM soit effective. 

35 A cet effet, la bascule B33 est relive par sa 

sortie Q a la liqne de requite de service rqst_SP a 
destination du processeur de gestion du lien parallele PGP, La 
sortie Q est reliee a l'une des entries de la porte logique 
0U23, I'entrSe s" a la phase 824 inversee du distributeur de 

40 phases et l'entree R au signal ack_5P. Le bus adr_X est relie 
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au bus adr_bloc_SP du processeur de gestion du lien parallele 
PGP. Une des lignes du bus adr_bloc_SP revolt la signal maj 
afin d'indiquer la nature de la requite : raise a jour. 
5 Des liberation du distributeur de phases par 

le signal f in_trensf ert_me j, la prochaine transition active de 
l'horloge geniSrale h provoque le passaqe de la phase 023 i Is 
phase B24. La phase 824 provoque une requite de service au 
processeur de gestion du lien parallele PGP (activation de la 

10 ligne rqst_SP) et le blocage du distributeur de phases jusqu'a 
l'acquittement de la requite par le signal ack„SP. A ce 
moment, l'ecriture en mise a jour aura ete ef f ectivement 
realised per le processeur de gestion du lien parallele PGP. 
Le distributeur de phases, sur la prochaine transition active 

15 de l'horloge h, va passer de la phase 824 a la phase 825. 

La mise h jour de la memoire cent rale RAH est 
terminee : la bascule B20 est mise a zero par activation de 
son entree ~ par la phase 825 inversee.J_a bascule B21 est 
mise h un par activation de son entree 5 par la phase 825, 

20 conditionnee par le signal maj au moyen de la porte logique 
ET22 via la porte logique N0U22. En cas de ddfaut 
d'inf ormation dans la memoire-cache, la purge d'un bloc ne 
constitue que la premiere partie de la requite : la demande 
7aTt_US est toujours presente, mais la liberation de la 

25 baacule B21 va permettre de prendre en compte d'eventuelles 
demandes de mises & jour en attente dans la file d'atten.te 
FIFO. Des que le file d'ettente FIFO est vide (empty = 0), 
tout le cycle decrit precddemraent se reproduit, avec cette 
. f ois- le bit de validatior. £ z^ro. On 3e retrouve alors dens le 

30 cas suivant. 

2feme cas : maj = 0. Ce cas se produit lorsque le bit de 
validation est egal h zero (par suite, peut-itre, d'une purge 
de bloc) ou lorsque le bit de validation est egal h un mais le 
bit de modification est egal a zero : la copie a jour de ce 

35 bloc est dej& en memoire centrale RAM. 

Ainsi, la requMe de service rqst_SR va 
entralner en retour un accord d'accis au repertoire de gestion 
RG et & la memoire-cache MC avec lecture du descripteur, 
memorisation des bits m et v, generation du siqnai maj, 

40 rSdcriture du descripteur avec v = 0 (maj est b l'etat loqique 
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zero, la bascule B31 est h l'etat logique zero et sa sortie Q 
vaut done un, ce qui impose un signal logique h l'etat un sur 
l'entr<§e sel20 du multiplexeur MUX20 et done force la 
5 constante 0) et liberation de l'eccfcs au repertoire de gestion 
RG et de la me moire-cache MC. Ces operations sont effectives 
dfee activation de la phase 923. 

Le bloc demand^ doi.t maintenant Stre lu dans 
la memoire centrale RAM. A cet effet, le signal maj inverse 
10 est'regu h l'une des entrees d'une porte loqique NET 2 1 , qui 
regoit sur son autre entree la phase 925. La sortie de la 
porte loqique NET21 est reliee aux entrees S des bascules B34 
et B35. La bascule B34 regoit sur son entree R le signal 
f in_recep tion en provenance de la logique de transfert TFR. Sa 
15 sortie Q est reliee au circuit dif f erenciateur D21. Ce circuit 
est relie h la porte logique 0U22. L'entree R de la bascule 
B35 est reliee au signal grnt_SR et la sortie Q h I'une des 
entrees de la porte logique 0U23. 

La lecture d'un bloc en memoire centrale RAM 
20 et son transfert dans la m6m oire-cache sont realises de la 
fagon suivante : la transition de la phase 923 h la phase 924 
declenche une requite de service au processeur de gestion du 
lien parallfele par activation de la ligne rqst_SP, issue de la 
bascule B33. Le type d'operation est cette fois une lecture 
25 (r_adr_X = 0) ou une-ecriture (w_adr_X = 0) et le bus adr_X 
fournit l'adresse du bloc demande sur le bus adr_bloc_SP. Le 
distributeur de phases est bloque jusqu^ arrivee du signal 
d'acquittement ack_SP : la demande de lecture ou d'ecriture a 
ete faite h la memoire centrale RAM par le processeur de 
30 gestion du lien parallfcle PGP, et le bloc a ete en m§me temps 
valide et marque "en attente" par ce mfeme processeur. Le 
transfert est done en cours, de la memoire centrale RAM vers ? 
le registre h decalage RDP. 

Le distributeur de phases, libere, fournit ? 
35 ensuite la phase 925. Cette phase, par l'intermediaire de la 
porte logique NET21 qui regoit sur son autre entree le signal 
maj inverse, va mettre h retat logique un les bascules B34 et 
B35. La bascule B35 bloque le distributeur de phases. La 
bascule B34 est remise h zero dfes arrivee du bloc demande dans 
40 le. registre RDP, signaie par l'activation de la ligne 
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fin.reception issue de la logique de transfert TFR, ce qui 
declenche l'ectivation du circuit dif f erenciateur D21 et une 
demande d'acces au repertoire de gestio n RG et a la memoire- 
5 cache MC, par activation de la ligne rqst.SR issue de la 
bascule B2A. 

L'accord d'acces, signale per la ligne 
7^Tt_SR, libere le distributeur de phases par remise a zero 
des bascules B25 et B35 et ouvre l'acces au repertoire de 
10 qestion RG et a la me no ire-cache MC. Le distributeur de 
phases, eur la prochaine trsnsition active de l'horloge 
qgnerale h, fournit la phase 826. _ 

Lb bascule B27, reliee au signal w_RG du 
repertoire de gestion, est active de 926 a 027, ce qui per.net 
15 de realiser la mise h jour du repertoire de qestion avec : 

- champ teq du bus data_RG = champ taq du bus 

a d r_X , 

- bit de validite v = 1 (maj s 0 et la sortie 
Q de la bascule B31 est a zero : le multiplexeur MUX20 laisse 

20 passer v, qui e ete force a un par le processeur de gestion du 
lien parallele PGP, ou deja remis 6 zero par le processeur 
espion PE), 

- bit de modification m = etat de la liqne 
T_adr_X du bus adr_X (demande d'ecriture entralne m = 1, 

25 demande de lecture m = 0), 

- bit d'attente de transfert a s 0, 

- bit f = 0. 

La bascule B31 active le signal w_MC de la 
memoire-cache MC de 826 a 027, ce qui permet d'ecrire le 

30 contenu du registre a decalaqe RDM (lea buffers BV26 sont 
valides par le sortie T de la bascule B31 et le signal maj 
inverse) dans le bon emplacement (champ -cadre- du bus adr 
relie au bus adr_MC) de la me m o i re-cache , v i a les buffers de 
validation BV22, commandes en sens de transfert par la 

35 bascule B31. 

A l'arrivee de la phase 827, la mise S jour 
du repertoire de gestion et de la memoire-cache est terminee. 
L'arrivee de la phase 827 provoque la remise a zero de la 
bascule B24, ce qui libere l'acces au repertoire de gestion RG 
40 et e la memoire-cache MC et l'ectivation de le sortie de la 
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porte logique ET23, remettant a un la bascule B21 et activant 
le signal ack"_US a destination du processeur de geation des 
requetes PGU : la requete est terminSe. 
5 Par ailleurs, le processeur espion PE est 

charge du maintien de la coherence des donnees dans la 
m6moire-cache MC ; a titre d'exemple, on a represents a la 
figure 15 une architecture de ce processeur. Celul- ci est 
d<§clench<§ a cheque transition active du signal valid du bus 
10 commun BUSA. 

Si le signal valid est active" par un 
processeur de gestion du lien parallele PGP autre que celui 
associ<§ au processeur espion PE, alars la tiche de ce dernier 
est la suivante, fonction du type de requete : 
15 r _ - requite en lecture de bloc de donnees non 

partagdes ou requete d'Scriture de mise a jour du bloc : 
ne*ant, 

- requite en lecture de bloc de donnees 

pertag6es ; 

20 ♦ bloc absent t n6ant, 

. bloc present et non modifie* : n£ant, 
. bloc present et modifie* : demande de 
purge du bloc (que ce bloc soit present ou en cours de 
transfert de la m6moire centrale RAM yers la ra 6moire-cache MC, 
25 6tat signale* par le bit -a- du descr ipteur) f 

- requite en Scriture de bloc de donnees 

partagdes t 

. bloc absent : ndant, 

. bloc present non modifie* s invalider 

30 le bloc, 

• bloc present modifie* : demande de 
purge de bloc (mime remarque que ci-dessus), <r 

- requete d'dcriture informative de bloc : 

♦ bloc absent ; n^ant, ? 
35 . bloc present non modifie : invalider 

le bloc, 

. bloc present modifie" : cas impossible, 

# si une demande d'£criture informative 
est eri attente sur ce mime bloc, elle est transform^ en 

40 requete en 6criture de bloc, car ce bloc a <§t<§ invalids ; a 
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cet effet, la requete en cours est annulee et un acquirement 
est renvoye au processeur de gestion des requ&tes PGU. Ce 
dernier consults le repertoire RG et va trouver le bloc 
5 sbsent t une requ&te est emise vers le processeur de gestion 
PGS. Cette operation est prise en compte par le procesaeur de 

gestion parallfele PGP. • 

Si le signal valid est active par le 
processeur de gestion du lien parallele PGP associe au 
10 processeur espion, alors la t&che de ce dernier est la 
suivante, fonction du type de requite (dite requite locale) : 

- requite en lecture de bloc de donnees non 
partagees ou requete d'«Scriture de mise b jour de bloc : 
neant, 

15 - requete en lecture de bloc de donnees 

partagees : marquer le bloc valide, en attente de transfert et 
non modifiS ( v = a = 1 et m = 0 ) , 

- requite en tlcriture de bloc de donnles 
partagees : marquer le bloc valide, en attente de transfert et 

20 modifi<§ (v s m s a s 1), 

- requite d'6criture informative de bloc : 

marquer le bloc "modifi6" (m = 1). 

Pour assurer les fonctions ci-dessus 
d«§crites, le processeur espion PE comprend un distributeur de 

25 phases DP_E, constitu<§ d'un registre a d«§calage SR40 et d'une 
bascule B40. La sortie d'un circuit d i f f 6 renc i a t e ur D4 0 est 
relive a l'entree I de la bascule B40_et 6 l'entree clearAO du 
registre SR40, ainsi qu'a 1'entrSe S d'une bascule B41. La 
sortie Q de la bascule B40 est reliee a l'entree aeriel_in40 

30 du reg'is'tre SR40. L'entree cik40 au reyistie 5R40 r ecoU le 
signal h d'horloge g<5nSrele et l'entree de validation en40 est 
reliee a la sortie Q de la bascule B43. La phase 041, 
inverse, issue du registre SR40 est relive & l'entree R de la 
bascule. B40. 

35 Le fonctionnement du distributeur de phases 

est conforme a la description faite dans le processeur de 

gestion des requites PGU. 

Le signal valid du bus BUSA est r e 1 i 6 a. 
l'entree du circuit dif f eTencieteur 040 et b l'entree de 

40 validation £^41 d'un decodeur DEC41. La bascule B41 regoit sur 
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son entrSe Tla sortie de la parte logique N0U40. La aortie Q 
de la bascule B41, a collecteur ouvert, est reliee au signal 
done du bus BUSA. 

5 Les signaux valid et done assurent la 

synchronisation du processeur espion PE avec les autres 
processeurs espions du systfeme multiprocesseur t la transition 
negative du signal valid dSclenche le circuit dif f <§rencieteur ? 
DAO qui produit une impulsion permettant d'ac ti ver le 

10 distributeur de phases et de mettre le signal done a l'etat « 
logique z6ro par l f interm6diaire de la bascule B41. La fin du 
travail de l'espion est signaled par un changement d'etat sur 
la sortie de la porte logique N0U4Q, qui produit la mise a 
l'6tat logique un du signal done par 1 1 intermediaire de la 

15 bascule B41. 

Le travail de l'espion est fonction de la 
nature de la demande et, a cet effet, le champ type du bus 
BUSA est connects h l'entree du decodeur DEC 41. Les sorties 
dnp et dmaj du decodeur DEC41 sont reliees aux entrees d'une 
20 porte logique 0U40. Les sorties dl, de, dei du decodeur DEC41 
sont relives aux entrees d'une porte logique QU41, les sorties 
de et dei etant iSgalement relives aux entrees d'une porte 
loqique 0U42. La sortie de la porte logique 0U40 est relive a 
l'une des entries de la porte logique N0U40 par 
25 l'intermediaire d'une porte logique ET40, qui recoit sur son 
autre entree le siqnal 941. La sortie de la porte logique 0U41 
est relive respectivemen t a l'une des entries de portes 
logiques ET42, ET43, qui recoivent sur leur autre entree 
respectivement le signal de phase 941 et 944. Les sorties des^ 

30 portes logiques ET42 et ET43 sont relives respectivement aux 
entrees sT et *R d'une bascule B44. La sortie^de la porte 
logique ET42 est ilgalement reliee aux entries 5 de bascules 
B42 et B43. Une porte logique N0U41 recoit sur ses entries le 
signal de phase 945 et la sortie d'une porte logique ET45, qui 

35 recoit sur ses deux entries la phase 944 et la sortie inversee 
d'une porte logique 0U43. La sortie de la porte logique N0U41 
est relive a I'ent r£e T de la bascule B42. La sortie 0 de la 
bascule B42 est relive au signal rqst_PR et le signal grnt_PR 
est d61ivr6 h l'entree R de la bascule B43, aux entries de 

40 validation de buffers de passage BV40, et a l'une des entries 
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de la porte logique 0U44. _La porte logique 0U44 revolt aur son 
autre entree le sortie Q "d'une bsscule B45, et sa sortie 
valids lea buffers de passage BV41. Le sortie de la porte 
5 logique ET45 est egalement reliee a l'une des entrees de Is 
porte logique N0U40 qui regoit sur une autre entree le signal 
de phase 945. Le sortie de la porte logique 0U42 est reliee 
eux entrees de portes logiques ET46 et ET47, qui regoivent 
egalement sur leurs entrees la sortie d'une porte logique 0U43 
10 et respectivement les phsses 944 et 945. La aortie Q de la 
bascule B44 delivre le aignal r_RG vie un buffer BV40,. le 
sortie ? de la bascule B45 delivre le signsl w_RG via un 
buffer BV40. Le champ cadre du bus commun BUSA est relie au 
bus adr_RG vie un buffer BV40. Le bus data_RG est relie aux 
15 sorties des buffers de validation BV41 et 6 1'entree du 
registre REG40, qui regoit sur son entree loed40 le signal de 
phase 943. La sortie du registre REG40 est reliee, pour le 
pertie teg, eux entrees des buffers BV41 et a l'une des 
entrees d'un compereteur C0MP40. Le compereteur C0MP40 regoit 
20 sur son autre entree la pertie tag du bus BUSA. Le bit de 
validation v, issu du registre REG40, connecte au comparateur 
C0MP40 a en regard la vsleur constsnte 1. Les bits v, a, m, f 
en sortie du registre REG40 sont relies respectivement a l'une 
des entrees des multiplexeurs MUX40 , M 11X41 , MUX42, MUX43. Les 
25 sorties de ces multiplexeurs fournissent l'etat de ces memes 
bits a 1'entree des buffers BV41. Le multiplexeur MUX40 regoit 
sur ses eutres entrees les constantes zero et un, les entrees 
8 el40 sont reliees a la sortie d'une porte logique ET48 et a 
un signal dlle. Le multiplexeur MUX41 regoit sur son sutre 
3C or.trds la constante un, selectee lorsque son. entree sel41, 
recevant un signal dlle issu du processeur de gestion PGP, est 
h l'etat logique un. Le multiplexeur MUX42 regoit sur ses 
autres entrees le constante un et le s ignal 7_edrbloc_SR, ses 
entrees sel42 regoivent les signeux dlei et dlle issus du 
35 processeur de gestion PGP. Le multiplexeur MUX43 regoit sur 
son autre entree la constante un, selectee lorsque son entree 
sel43, reliee a la sortie d'une porte logique ET49, est a 
l'etat logique un. Le porte logique ET49 regoit sur ses 
entrees la sortie eq40 du compereteur C0MP40, le signel f 
40 inverse et le signal m. Le porte logique ET48 regoit sur ses 
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entries la sortie eg4Q, le siqnel m inverse, le signal dlei et 
la sortie de la porte logique 0U42. La porte logique 0U43 
recoit sur l'une de ses entrees le signal eg40, et sur son 
5 autre entree le signal dlle. La sortie de la porte logique 
ET49 est Sgalement relive h l'entrtfe load41 de la file 
d'attente FIFO, de*ja dScrite dans le processeur de gestion du 
lien sSrie PGS. Les champs cadre et tag du bus BUSA son t 
reli§s a 1'entrSe de la file d'attente FIFO. Les signaux dlei, 
10 dlle et 7_adrbloc_SP proviennent du processeur de gestion du 
lien parallele PGP, qui recoit par ailleurs le signal dei du 
ddcodeur DEC41. 

Le f one t ionnement de 1 'ensemble est le 
suivant : ^activation du signal valid initialise le 
15 distributeur de phases DP_E et valide le d«5codeur DEC41 qui 
produit I'activation d'une sortie fonction de l 1 information 
type codant la nature de la demande en cours sur le bus commun 
BUSA. La sortie active peut etre ! 

- dnp : requete en lecture de donn£es non 
20 partaqSes. Le signal "done est d6sactivd a 1'apperition de la 

phase 941 ; 

- dmaj : requete d'^criture de mise a jour de 
bloc. Le signal done est defective* a la phase 941 ; 

- dl : requite de lecture de bloc ; 
25 -de : requite d'Scriture de bloc ; 

- dei : requite d'Scriture informative. 

Ces trois cas n£cessitent un acces en lecture 
au repertoire RG, et les deux derniers une r^criture 
gventuelle du repertoire. A cet effet. une requite d'acces est 

30 eVise vers le processeur de qestion du repertoire PGR par la 
bascule B42 (signal rqstJ*R) f la bascule B43 inhibant le 
distributeur de phases jusqu'a accord d'acces, signifie* par le 
signal g7n"t_PR. La lecture s'effectue done de 941 a 944 
(bascule B44) et 1'Sventuelle Scriture de 944 b 045 (bascule 

35 B45) avec memorisation du descripteur dans le registre REG40 
lors de la phase 943. Si le bloc e st ab sent de la m£moire- 
cache MC (eg40 = 0), alors le signal done est d«§sactive* sur la 
phase 944. Si le bloc est present dans le cache (eg40 = 1), 
alors : 

40 - si m s 1, une demande de purge est active^ 
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(activation ports logique ETA9) a condition que ce bloc ne 
..it Pas deje dans la file (f . 0) | 1. seul bit modif ie est 
f, mis a un, lors de la reecriture du descripteur, 

_ si m = 0, le bloc est invalide par le 
multiples MUX40 (activation de la porte logiquej:T48) , 

- si la demande est locale (dlle ou dlei 

actif), alors : 

1) en cas de lecture ou d'ecriture, les 
10 bits v et a sent mis a Ijt m est mis a 0 (lecture) ou 1 

Ucriture) (<§tet du signal T_adrbloc_SP ) , 

2) en cas d'ecriture informative, le bit 

m est force' a 1. 

Dans ces derniers cas qui demandent une 
15 reecriture dana le repertoire de gestion RG, le signal done 
est dt§sactiv6 sur la phaae 045. 

Le processeur de geation du lien parallels 
PGP, dont un exemple eat represents a la figure 16, est charge 
de requerir le bus commun BUSA et de rSaliser la transaction 
20 demendee, soit par le processeur de gestion des requStes PGU, 
soit par le processeur de gestion de la liaison s«§rie PGS. 

Une demande issue du processeur de gestion 
des requ&tes PGU ne peut 6tre qu'une requfete d'ecriture 
informative. Une demande iaaue du processeur de gestion de la 
25 liaison serie PGS est, soit une demande de lecture ou 
d'ecriture de bloc, soit une demande de mise a jour de bloc. 

Le processeur de gestion du lien parallfele 
PGP comprend une bascule B60, reliee per son entree de donnee 
D au signal TqTt_UP. Une bascule B61 est reliee par son^ entree 
30-de donnee D au signal rn«t_SP. Les sorties Q et Q d'une 
bascule B62 sont relives respect ivement aux entries horloges 
des bascules B60 et B61. La sortie 0 de la bascule B62 est 
rebouclee sur son entree de donnee. Les sorties Q des bascules 
B60 et B61 sont reliees aux entrees d'une porte logique 0U60. 
35 La sortie de la porte logique 0U60 est relive, d'une part, k 
un circuit d i f f <§r enci a t eur D60, d'autre part et de facon 
inverse, & une entree d'une porte logique ET60, qui recoit 
sur son autre entree le signal d'horloqe g6n«5rale h. La sortie 
de is porte logique ET60 est relive a 1'entree horloge de la 
40 baacule B62. La sortie du circuit d i f f erenci a t eur 060 est 
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reliSe a l'entrie T d'une bascule B63. La aortie Q de la 
bascule B63 ddlivre un siqnal rqati a destination de l'arbitre . 
AB, et son entree *R est relide h la sortie d'une porte logique 
5 ET62. Le signal grnti issu de l'arbitre AB est relie§ & des 
portes logiques 0U62 et N0U60. La porte logique 0U62 recoit 
sur son autre entree le signal valid inverse^ et sa sortie est 
relive a 1'entrSe d'un circuit dif f Srenciateur D61. La sortie 5 
de ce circuit D61 est relive a l'une des entries de la porte 
10 logique ET62 et a l'entr^e T d'une bascule B64. La sortie Q de ; 
cette bascule B64 est relive a l'entrie de validation de 
buffers de passage BV60 et de facon inverse^, a travers un 
inverseur a collecteur ouvert 160, au signal valid. Le signal 
done est reli<§ a 1'entrge d'un circuit dif f tireneiateur D62. La 
15 sortie de ce circuit D62 est reliee a 1'entrSe R de la bascule 
B64 et a 1'une des entries de la porte logique N0U6O. La 
sortie de cette porte logique N0U60 est relive b l'une des 
entries de portes logiques NET 60 et N ET 61 , qui regoivent sur 
leur autre entree, respect ivement les sorties Q des bascules 
20 B60 et B61. Les sorties *0 des bascules B60 et B61 sont 
£galement relives respec ti vement aux entries de validation des 
buffers de passage BV61 et BV62. La sortie de la porte logique 
NET60 est relive, d'une part, a 1'entrSeTde la bascule B60, 
d'autre part, a l'une des entries d'une porte logique ET63, 
25 qui repoit sur son autre entree la sortie d'un circuit 
di f f 6rencie teur D63. La sortie de la porte logique ET63 
d^livre le signal acq_UP vers le processeur de gestion PGuV La 
sortie de la porte loqique NET 61 e st r eliee a l'entr^e 5 de la 
bascule B61 et fournit le signal ack_SP. Le bus adr_bloc_UP 
30 est reli<§ 6 1'entrSe des buffers de validation BV61 et^a l'une 
des entries d'un comparateur C0MP60. 

Le bus adr_bloc_SP est reli£ a l'entr^e des 
buffers de validation BV62. Les sorties des buffers BV61 et ? 
BV62 sont relives ensemble et a l'entr^e des buffers de 
35 validation BV60. La sortie des buffers BV60 est reliee au bus* 
commun BU 5 A . Des portes logiques 0U63 et 0U64 regoivent sur 
leurs entries respectives les sorties Q des bascules B60 et 
B61, le signal logique grnti et le siqnal mej po ur 0 U64. La 
sortie de la porte logique 0U63 dSlivre le signal dlei, et le 
40 sortie de la porte logique 0U64 le signal dlle. L'autre entree 
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du comparateur C0MP60 recoit les champs taq et cadre du bus 
commun BUSA. L'entree en60 du comparateur C0MP60 est reliee a 
la sortie de la porte loqique ET61, qui recoit 8U r ses _entrees 
5 le signal gTotT inverse, le signal dei et le signal rqst_UP 
inverse. La sortie eg60 du comparateur C0MP60 est reliee a 
l'entree du circuit di f f erencieteur D63. La sortie de ce 
circuit est egelement reliee eux entreee R des bascules B60 et 
B61 et b l'autre entree de la porte logique ET62. 
10 Le f onctionnement de l'ensemble est le 

suivant : 

Les bascules B60, B61 et B62 essociees aux 
portes logiques ET60 et 0U60 constituent un arbltre loc al. Cet 
arbitre examine elternativement les requetes rqst_UP et 
15 7qTt_SP, et les repercute vers l'arbitre AB du bus commun BUSA 
par le signal r^Tti. L'acco rd d'acces est fourni par la 
validation du signal grn ti et le cycle bus a lieu des 
deactivation du signal valid qui libere l'arbitre AB. 
L'activation du signal done libere l'arbitre local : la 

20 transaction est terminee. 

Si la requite provient du proces seur de 
gestion de la liaison serie PGS, alors les signaux dlei et 
dlT7 indiquent au processeur espion PE associe la nature de le 
mise a jour des bits d'etets du bloc a effectuer dans le 

25 repertoire RG. 

Si la requite provient du proce.sseur de 
gestion des requetes PGU, alors en cas de detection d'ecriture 
informative sur le meme bloc (signal dei en provenance du 
processeur espion PE), une liberation immediate a lieu : le 

30 processeur de gestion des requites PGU, epres consultation du 
repertoire (le bloc e ete invalide) aiqulllera sa demande vers 
le processeur de gestion de la liaison s«§rie PGS. 

Le processeur de gestion mSmoire PGM dont un 
exemple est represents a la figure 17, est charge d'assurer la 

35 lecture ou l'ecriture de bloc en memoire centrale RAM et de 
participer su maintien de la coherence de l'inf ormetion dans 
les diverses memoires-caches HC du systeme raultiprocesseur . 

A cet effet, il comprend un circuit 
dif ferenciateur D80 recevant surjon entree un signal valid et 

AO relie par aa sortie aux entrees S de bascules B80 et B81 ainsi 
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qu'a l'entr<§e clr_BO d'un registre & decalaqes SR80. Sur la 
sortie If de la bascule B80, a collecteur ouvert, eat de*livr<§ 
le signal done. La sortie Q de la bascule B81 est relive a 
5 l'entree serial^inBO du registre SR80 ? cette bascule B81 est 
relive par son entree T h la sortie 081, inverse^, du registre 
SR80. Le registre SR80 recoit sur son entree clkSO le si gnal ? 
d'horloge g<Sn<§rale h et son entree de validation en80 est 
toujours active. La bascule B81 et le registre h ddcalag e SR80 ^ 
10 constituent un distributeur de phases DP_M. Le sig nal valid 
est <§galement d(§livr<§ sur l'entr^e de validation en81 d'un 
decodeur DEC80. Ce decodeur est relie* par son entree de donn^e 
a la partie type du bus commun BU5A, et fournit les siqnaux 
dnp, dl, de, ei et maj. Une mSmoire vive RAMFG de largeur 2 
15 bits (d6nomro6s respect ivement ro et rw) recoit sur son bus 
adresse les champs tag et cadre du bus commun BUSA. Le bus de 
donnSe de cette mSmoire, constitue" des bits ro et rw, est 
reliS d'une part a une logique PALBO, d'autre part a une porte 
logique ET80 f en direct pour rw, de facon inverse^ pour rd. La 
20 logique PALBO est relive au champ type et recoit des signaux 
logiques cl, r/w, s/n, mff et en82 : le siqnal cl est issu 
d'une bascule B82, les signaux r/w et s/n d'une file d'attente 
associative AFIF0, le signal mff d'une porte logique ET81, et^ 
le signal en82 d'une bascule B83, qui recoit sur ses entries S 
25 et 7 respectivement des signaux -982 et 981 inverses du 
distributeur de phases DP_M. La logique PAL cable sur ses 
sorties ro-rw les equations logiques suivantes : dnp = 10 ; 
dl.mf f = 10 ? dl.nff s 01 { de = 01 ; maj.'cl = 00 ; 
ei s 01 ; ma j.cl.s/n.r/w = lu ; ma j.ci.s/n.r/w = 01. La sortie 
30 de la porte logique ET8Q est relive a 1'entree D d'une bascule 
B84, qui recoit sur son entree horloge la phase 982. La sortie 
0 de cette bascule est reliee a l'une des entries de la porte * 
logique ET81, qui recoit sur son autre entree la sortie de la 
porte logique 0U80. Les deux entries de cette porte logique * 
35 0U80 sont relives aux sorties de et dl du decodeur DEC80. 
L'entr6e de lecture r de la memoire RAMFG est relive a la 
phase 981, et 1'entr^e d'ecriture w a la sortie d'une porte 
logique ET82. La porte logique ET82 recoit sur ses entries le 
siqnal 983 et la sortie d'une porte logique ET83, dont les 
40 entries sont relives au signal s/n" et a la phase 987. Le 
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sortie dnp du decodeur DEC80 est reliee k des portes logiques 
ET84 et ET85, qui regoivent sur leur autre entree 
respectivement les phases 981 et 085. Le signal s/n est 
5 eqalement delivre vers des portes logiques ET86 et ET87 qui 
regoivent sur leur autre entree respectivement les phases 886 
et 090. Ls sortie mff de la porte logique ET81 est egelement 
reliee k une porte logique ET88, qui regoit sur son autre 
entree la phase 883, et de facon inversee 6 des portes 
10 logiques ET89 et ET90 qui regoivent sur leur autre entree 
respectivement les phases 883 et 087. La sortie de la porte 
logique ET 88 est reliee k 1'entree wff de la file AFIF0. Les 
sorties des portes logiques ETB4, ET86, ET89 sont reliees aux 
entrees d'une porte logique 0U81, dont la sortie est reliee k 
15 1-entree S d'une bascule B85. Les sorties des portes loqiques 
ET85, ET87, ET90 sont reliees aux entrees d'une porte logique 
0U82, dont la sortie est reliee k 1'entree R de la bascule 
B85. Le signal s/n est egalement relie, de fagon inversee, k 
une porte logique ET91 qui regoit sur son autre entree la 
20 phase 889. La sortie de la porte logique ET91 est reliee k 
1'entree d'une porte logique N0U80 qui regoit sur son autre 
entree la sortie de la porte loqique 0U82. La sortie de ]. 
porte loqique N0U80 est reliee k 1'entree R de la bascule B80. 
La sortie maj du decodeur DEC80 est reliee 6 1'entree de 
25 portes logiques ET92, ET93, ET94, ET95, qui regoivent sur leur 
autre entree respectivement les phases 081, 085, 085, 091. Les 
sorties des portes logiques ET92 et ET93 inverses sont 
reliees respectivement aux entrees S et R d'une bascule B86, 
et celles des portes logiques ET94 et ET95 aux entrees S et R 
30 d'une bascule B82. La sortie 0 de la bascule B82 produit le 
signal logique cl egalement delivre k 1'entree off de ls file 
AFIF0 et k 1'entree de commande sel80 d'un multiplexeur MUX80. 
La partie tag, cadre du bus commun BUSA est reliee k 1'entree 
de donnee de la file AFIF0 et k l'une des entrees de donnees 
35 du multiplexeur HIJX80. La sortie dl du decodeur 0EC80 est 
egalement reliee k l'une des entrees de donnees de la file 
AFIF0 afin de produire le signal de lecture/ecriture 1/e. Lo 
sortie de donnee de la file AFIF0 est reliee k 1'autre entree 
du multiplexeur HUX80. La sortie du multiplexeur MUXBO est 
40 reliee au bus adresse de la memoire centrale RAM pour le 
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partie tag-cadre, et aux entrees de decodeurs DEC81 et DECB2 
pour la partie champ cpu. La sortie 0 de la bascule B86 est 
reliSe & l'entree d'ecriture de la memoire centrale RAM et 6 
5 l'entree du decodeur DEC62. La sortie 0 de la bascule 

B85, legerement retardee, est relive & l'entree de lecture de 
la memoire centrale RAM et h l'une des entries d'une porte 
logique ET96, qui regoit sur son autre entree la sortie de la 
porte loqique 0U82. La sortie de la porte logique ET96 est 
10 relive b l'entree en83 du decodeur DEC 8 1 . La sortie j du 
decodeur DEC81 est relive & l'entree de validation des buffers 
de passaqe du registre h dilcalaqe memoire RDM j et la sortie j 
du decodeur DEC82 6 l'entree de chargement dudit registre h 

' decalage memoire RDM j. 
15 Le f onctionnement de cet ensemble est le 

suivent : 

L'activation du signal valid provoque le 
ddclenchement du distributeur de phases DP_M, et la validation 
du decodeur DEC80, qui ve permettre de determiner la nature de 

20 la requete. La phase 881 est utilis^e pour lire l'etat des 
bits correspondent .au bloc demande dans la memoire RAMFG, et 
la combinaison ro.rw est m6moris6e dans la bascule B84. Une 
premiere dcriture'a lieu dans la memoire RAMFG sur la phase 
683, qui permet de mettre b jour les bits d'etets. Leur valeur 

25 est fournie par la logique P ALSO et permet d'obtenir les 
enchainements suivants : 

- en cas de requfcte de bloc de donn^es non 
pertaqSes (dnp) alors quel que soit l'etat des bits ro.rw (rw 
est forewent k z6ro), l'etat 10 est force ("bloc diffuse* en 

30 lecture") ; 

- en cas de demande de bloc en lecture (dl) 
ou en <§criture (de), si ro.rw = 01, alors la requite est mise 
en file d'attente sur la phase 983 et l'etat 01 est force (en 
fait, e'est l'etat precedent), sinon l'etat 10 est force* en 

35 cas de lecture ("bloc diffuse en lecture") et l'etat 01 est 
force en cas d'ecriture ("bloc diffuse en ecriture") ; 

- en cas de demande de mise h jour (maj), 
l'etat 00 est forcd ("bloc non diffuse"). Dans ces divers cas, 
une lecture ou une ecriture en memoire centrale RAM est 

40 operee, vers ou h partir du registre h decalage memoire RDMj 
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identifie par le champ cpu du bus commun BUSA. Dans 1'exemple 
cholsi, la duree du cycle memoire RAM est de A periodes de 
l-horloqe generale h. En cas de lecture de donnees non 
5 partegees, le cycle s'effectue de 981 a 985, dans les autres 
cas de 683 a 987. L'ecriture s'effectue de 981 a 985 ; 

- en cas d'ecriture informative, celle-ci ne 
provoque pas de mouvement de donnees, mais force lea bits 
d'etats a la valeur 01 d'etat de depart est dans ce cas 

10 forctment 10) ; 

- en cas de demande de raise a jour, une 
consultation de la file d'attente AFIFO est systemetiquement 
operee. Cette consultation peut entralner la lecture d'un 
bloc, dans le cas ou une unite centrale CPU est en attente 

15 dans la file AF1F0 de raise a jour de ce bloc. 

La lecture s'effectue de 986 a 990 et l'etat 
des bits est force a 10 (demande pour une lecture) ou 01 
(demande pour une e c r i ture ) . La fin de toute operation se 
traduit par la reraise a zero de la bascule B80 qui active le 
20 signal done". Cette deactivation peut se produire sur les 
phases 985, 987 ou 991 selon l'operation demandee, ou sur 989 
si la consultation de le file donne un resultat negatif. 

La file d'attente associative n'est pas 
detaillee. File est constitute de fagon classique d'une 
25 memoire associative utilisee en file d'attente. Le nombre de 
mots de cette memoire est egal au nombre d'unite centrale CPU 
du systeme multiprocesseur . Un "daisy-chain" interne identifie 
sur cheque phase 981 le prochain mot candidat a une ecriture, 
qui se produit le cas echeent sur la phase 983 par le signal 
30 wff. Le signal off declenche une comparison a partir de la 
phase 985, les bascules de la memoire de reponse ayant ete 
remises a zero sur la phase 984. Le resultat de la comparaison 
est repercute sur le signal s/n (some/none) et le contenu du 
mot concerne est disponible sur la sortie de donnees a partir 
35 de la phase 986. Ce mot est ensuite invalide sur la phase 990. 

Dans l'architecture ci-dessus d6crite, les 
processeurs espions PEj sent sollicites a cheque transfert 
d'adreases aur le bus commun BUSA, avec consultation 
eventuelle de leur memoire-cache M Cj . Cette consultation est 
40 la plupart du teraps inutile (faible probabilite de oresence de 
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l'adresse du bloc cor reapondant au transfert, dans les 
memoires-caches) . 

II est a noter que le processeur de gestion 
5 memoire PGM maintient des bits d'etat des blocs et rend 
possible une gestion centralist du maintien de coherence. A 
cet effet, l'on peut rajouter a 1 ' archi tecture ci-dessus 
decrite (figure 10) un bus parallfele de synchronisation 
fonctionnant selon le meme algorithme que le bus de 
10 synchronisation SYNCHRO de la variants qui eat decrite ci- 
aprfes. Les processeurs-espions ne sont plus alors a proprement 
parler des espions (puisque connectes sur le bus de 
synchronisation et non sur le bus commun BUSA), et sont 
designes par processeurs de maintien de coherence (PHCj oour 
15 la variante de la figure 18). Ainsi, le processeur de gestion 
memoire PGM demeure sollicite a chague transfert sur le bus 
commun BUSA, mais les processeurs de maintien de coherence 
sont sollicites par le processeur PGH uniguement lorsqu'ils 
sont concernes par le transfert. 
20 La figure 18 presenteune variante dans 

laguelle la coherence est maintenue selon le principe ci- 
dessus evogue. Cette variante reprend I'architecture generale 
de la figure 6, avec des adresses de blocs qui transitent par 
les liaisons series LSj. Ce systeme comprend un bus parallfele 
25 de synchronisation SYNCHRO, de meme structure logique que le 
bus commun BUSA, mais pilote h la seule initiative rtu 
processeur de gestion memoire PGM. 

I. a structure de l'unite centrale UCj est 
conforme fe celle presentee fe la figure 10, avec quelques 
30 modifications : 

- la structure de la memoire-cache MCj reste 
la meme, ainsi que la structure du repertoire de gestion RGj, 

le processeur de gestion parallfele PGPj 
disparalt, puisque le bus commun BUSA n'existe plus et les 
35 fonctions qui lui etaient attributes sont reportees sur le 
processeur de gestion de la liaison serie PGSj ; 

- ]e processeur espion PEj est remplact par 
un processeur de msintien de coherence PMCj qui s'occupe du 
maintien des bits d'etats des blocs dens la me moire-cache MCj 

40 en vue d'en assurer la coherence et qui est active fe le seule 
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initiative du processeur de gestion memoire PGM j via le bus de 

synchronisation SYNCHRO 5 

- le processeur de gestion des requetes PGU 
5 ne connalt plus qu'un seul partenaire : le processeur de 

gestion de la liaison serie PGS jf sur lequel 11 reporte 

toutes ses requites j 

- le processeur de gestion de la liaison 

eerie PGSj est charge du trensfert des adresses et des 
10 oonnees, conformant au principe decrit pour le systeme de la 
figure 6, cheque adresse Stent prefixee par la nature de le 
requite j 

- les fonctionnelites du processeur de 
pestion memoire PGM sent celles decrites en reference a la 

15 figure 17, son activation n'etant plus assuree per le signal 
TaTId, qui disparait (puisqu'auparavant associS au bus commun 
RUSA), mais par l'arbitre ABM decrit dans le systeme de le 
figure 6, lequel serielise les demandes de service qui 
transitent par les liaisons series. La memoire RAMFG est 

20 egalement constitute d'un champ supplemental cpu associe aux 

bits d'6tats ro.rw. 

Le f onctionnement general du mode de 

realisation represent a la figure 18 est le suivant t 

Cheque requete du processeur de traitement 

25 CPU active le processeur de gestion des requetes PGUj avec 
1'indication lecture ou ecriture et code ou donnees. Ce 
processeur requiert un accfes au repertoire de gestion RGj 
auprfes du processeur de gestion du rSpertoie PGRj. Le 
consultetion du repertoxre conuuiL a i'on des cas suivants : 

30 ._ ie bloc est present dans la mempire-cache 

MC«, avec l'etat non modifie (m = 0) 5 si la demande est une 
lecture, 1 ' in f or ma t i on demandee est extreite de la m6moire- 
cache MCi et fournie eu processeur de treitement CPUj. Si le 
demande est une ecriture, alors une requete d'ecriture 

35 informative ei est transmise au processeur de gestion de la 

liaison s«§rie PCSj ; 

- le bloc est present dens la memoire-cache 

HCj , avec l'etat modifie (m = 1) 5 la demande, lecture ou 

ecriture, est satisfaite ; 
4Q _ ie bloc est ebsent de la m<5moire-cache 
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MCj ? une requite de bloc en lecture ou ecriture est trensmlse 
au processeur de gestion de la liaison sdrie PGSj* 

Ainsi, les requites faites au processeur de 
5 gestion de la liaison sdrie peuvent etre : une demande de 
lecture de donn6es non partagSes (code) s dnp, une demande de ? 
lecture de bloc j dl, une demande de lecture de bloc en vue 
d f y effectuer une 6criture t de, une demande d'Scriture ^ 
informative : ei. 

10 A ces divers Stats, il faut ajouter l'Stat 

mise a jour maj correspondant a la purge d f un bloc, soit a la 
demande du processeur de maintien de coherence PMCj, soit pour 
lib^rer un emplacement de bloc dans la me* moire-cache. Les 
adresses ainsi prSfixSes transitent par les liaisons series 

15 LSj, et conf orm<§ment au principe 6nonce* lors de la description 
de l'architecture de la fiqure 6, sollicitent l'arbitre ABM 
lorsque : 

- en cas de lecture bloc, 1'adresse est 

transmise, 

20 - en cas d'£criture bloc, 1'adresse et la 

donnSe sont transmises. 

Ces requetes sont traitSes s£quentiellemen t 
par le processeur de qestion m^moire PGM, de meme structure 
g<Sn<Srale que celle d^crite a la figure 17. Leur traitement est 
25 le suivant : 

1/ dnp : demande de donnees non partaq^es. Le 
bloc est transmis et prend l'Stat ro.rw =10. 

2/ dl : demande de lecture d'un bloc* 

Si le bloc est dans 1'dtat "non diffusfi" 
30 (ro.rw = 00) ou "diffuse* en lecture" (ro.rw * 10), il est 
transmis et prend ou garde l'£tat ro.rw = 01. *• 

Si le bloc est dans l'<§tat "diffuse en 
Ecriture", la demande est mise dans la file d'attente AFIF0. ? 
Le processeur de gestion mdmoire PGM trouve alors danc le 
35 champ cpu de la mdmoire RAMFG 1'adresse de la m<§mo ire-cache 
MC i qui contient la version a jour du bloc demand^. Une 
requite de purge est alors Smise sur le bus de synchronisation 
SYNCHRO, a seule destination du processeur de maintien de 
coherence PMCi associS a la m£moire-ceche MCi concerns. Cette 
AO demande peut §tre qualified de commande adress^e. 



SS0022002258 



WO 89/06013 PCT/ER88/00608 

69 

On notera que le processeur de maintien de 
coherence PHC^ n'a pas a consulter le repertoire de ^stion 
RG . aesocie puisque le processeur de gestion memoire PGM a 
5 connaissance du fait qu'il est seul possesseur de la copie a 
jour. Son rSla conaiate aimplejnent a prelever la requite et a 
la deposer dans la file FIFOj aasociee. 

3/ de : demande de lecture d'un bloc en vue 

d'y faire une icriture. 
1Q si le bloc est dans l'dtat "non diffuse" 

(ro.rw = 00), il eat transmis et prend l'etat "diffuse en 

6criture" (ro.rw =01). 

Si le bloc est dans l'etat "diffuse en 

lecture" (ro.rw = 10), alors le processeur de gestion memoire 
15 emet une commande universelle d' in vel i da t ion de bloc, puis. 
trans.net le bloc avec l'etat "diffuse en ecriture" 
(ro.rw s 01). La commande universelle provoque l'ectivation de 
tous les processeurs de maintien de coherence PMCj qui 
executent strictement les mimes operations que celles decrites 

20 pour le systirae de la fiqure 10. 

Si le bloc est dans l'etat "diffuse en 
ecriture", la demande est mise en file d'attente AFIFO. Comme 
precedemment, le processeur de gestion memoire PGM emet une 
commande edreasee eu seul possesseur de la copie h Jour. 

25 4/ maj : demande d'ecriture d'un bloc par 

suite d'une purge. 

L'algorithme de f one tionnem ent est dans ce 

cas strictement le mime que celui decrit en .reference a la 
figure l 7 pour le processeur PGM. 
30 il est s noter que le problime de 

I'acquittement de l'ecriture trouve naturellement sa solution 
dans ce mode de r e a 1 i s a t i on pa r une commande adressee 
d ' acquittement . 

5/ ei i Ecriture informative. 
35 ce cas est traite directement aur le bus 

commun BUSA dans 1'architecture presentee a la figure 10. Dans 
le mode de realisation vise ici, et afin de qerantir la 
synchronisation, cette operation est prise en charge par le 

processeur de qestion memoire PGM. 
A0 Si le bl.oc est dans l'etat "diffuse en 
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lecture", alors une commende, a la fois universelle et 
adressee, est emise : adressee en ce sens que le processeur de 
maintien de coherence PMCj concern^ note l'acquitteroen t de la 
5 demande d'ecriture informative et paaae le bloc concern^ dans 
1'dtat "modifie" dans le repertoire de gestion RGj , 
universelle en ce sens que tous les autres processeurs PMZ^ 
doivent invalider.ee bloc dans leur repertoire. 

Le bloc dans I'etat "diffuse en ecriture" 
10 indique qu'une demande d^criture informative a 6t6 traitee 
sur ce meme bloc pendant le temps d'attente de traitement de 
la requite. Dans ce cas, la demande d'ecriture informative est 
transformed en demande d'e'eriture de, et suit le m % m e 
traitement que dans le cas cor respondan t de I'ecriture. 
15 Le bus parallfele de synchronisation SYNCHRO 

est charge de dTffiiser des adresses de bloc pr^fix^es par un 
numdro de processeur et un type de demande, soit environ 30 
a 40 bits selon les caracteristiques du multiprocesseur. Ces 
informations sont de plus trans mis es de fagon 
20 unidirectionnelle. Leur transfert peut alors avantageusement 
la encore se faire par une liaison s^rie. La cadence de 
transfert est moins critique que pour les blocs, et des 
solutions simplifies peuvent atre envisagees, par exemple par 
le biais de circuits "TAXI" fabrique"s par la Societe "A.M.D.". 
25 La figure 19 presents un schema synoptique 

partiel d'une architecture conforme a 1 'invention, dans 
laquelle plusieurs unites centrales UC k ... sont reunies en 
grappe ("cluster") et partagent une m%me liaison eerie LS^. 
Dans ce but, un arbitre local ABL k essocie a la grappe est 
30 charge d'arhitrer les cohflits d'acces aux moyens de 
communication d'adresses de blocs, et partage avec le 
processeur mdmoire PGM, amenage a cet effet, un signal busy k 
indiquant en per m a n ence 1 1 e t a t libre ou occup^ de la liaison 
serie L5 k . Des moyens de codage et de decodage d ! un en-tete 
35 d'identif icat ion du processeur concern^ a l'interieur d'une 
qrappe sont associes aux logiques d'emission et de reception 
des blocs de donnees* 

Dans le cas oCi les moyens de communication 
d'adresses de blocs sont constitues par le bus commun BUSA, le 
40 f onctionnement est le suivant : 



SS0022002260 



WO 89/06013 



PCT/FR88/00608 



71 

Si I'unite centrale CPU k+ j desire faire un 
transfert de bloc dans le sens m6moire centrale RAM. vers 
mSmoire- cache MC k + j (cas dnp, dl, de) ou effectuer une 
5 ecriture informative ei, alors elle requiert l'ecces vers le 
bus coromun BUS A a l'arbitre local ABL k , qui r^percute la 
demande, son tour venu, a l'arbitre AB. L'accord d'acces au 
bus commun BUSA est renvoye sup I'unite centrale CPU k +j et le 
transfert s'effectue de la facon decrite en reference h la 

10 figure 10. Tout bloc transmis dans le sens mSmoire centrale 
RAM vers me* mo i re-cache MC k+ j doit alors etre identifie, car 
l'ordre des demandes n'est pas respecte du fait de la 
possibility de mise en attente dans la file AFIFO du 
processeur de gestion mSmoire PGM. Si I'unite centrale CPU k+J . 

15 desire faire un~ transfert de bloc dans le sens m£moire-cache 
MC k + j vers 18 m6moire centrale RAM (cas maj), alors elle 
requiert tout d'abord de l'arbitre local ABL k l'acces a la 
liaison s^rie LS k . L'arbitre local ABL k et le processeur de 
gestion memoire PGM sont susceptibles tous deux de s'attribuer 

20 la liaison se~rie L S k : la contention est <§ v i t £ e en 
synchronisant la modifiction du signal busy k avec le signal 
valid (le processeur de gestion memoire PGM ne peut lancer ou 
relancer un transfert qu'eu cours d'une transaction mercoire). 
L'accord d'occupation de la liaison s^rie LS k conduit I'unite 

25 centrale CPU k+J - a transferer son bloc d ' i n f o r m a t i on vers le 
registre a dScalage memoire RDM k , puis a requerir de l'arbitre 
local ABL k l'acces au bus commun BUSA afin d'y effectuer la 
demande de mise a jour, qui s'effectue selon 1 » a 1 gor i t hm e 
decrit en reference a la figure 10. L'Scriture de mise a jour 

30 peut entrainer une liberation de bloc dans la file d'attente 
AFIFO du processeur de gestion memoire PGM et requerir un 
registre a decalages RDM j occupe. Dans ce cas, le transfert 
demands est retard^ et chaine* au transfert en cours. 

Dans le cas ou les moyens de communication 

35 d'adresses de blocs sont les liaisons series elles-m§mes, le 
fonct ionnement est alors identique au cas precedent pour ce 
qui est de la preemption de la liaison s«§rie, et identique 
pour l'alqorithme general de fonct ionnem en t a celui presente 
en reference a la fiqure 17. 

40 Par exemple, une demande de lecture de bloc 
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issue de l f unit6 centrale CPU k + J - ndeessite tout d'abord un 
accord d'acces a la liaison sdrie LS k> accord donnd par 
l ! arbitre local ABL^ en concertation av«ec le processeur de 
5 gestion mdmoire PGM. L'accord d'accfes entraine le transfert de 
l'adresse du bloc demand^ sur la liaison s6rie LS^, qui est 
"aussitot lib£r6e : elle est disponible pour toute autre 
transaction si ntcessaire. Une demande d^criture de bloc suit 
le mine protocole pour l'acces h la liaison s6rie LS^. 
10 Dans les- architectures d£crites en r6f6rence 

aux figures 1 a 19, il existait autant de registres a 
d6calages me*moires RDMj que d'unit^s centrales CPUj : une 
liaison s£rie LSj 6tait affectde de fagon statique a un couple 
( RDM j , CPUj). 

15 S f il doit h l'Svidence exister au moins une 

liaison s£rie LB. entre une unit£ centrale et la memoire 
centrale RAM, le nombre de registres a decalages RDMj peut 
Itre inf£rieur. En. effet, si tacc est le temps d'accfcs a la 
memoire centrale RAM et ttfr le temps de transfert d'un bloc, 

20 il n'est pas possible de maintenir plus de n s ttfr/tacc 
registres h decalages simul tan£ ment occup6s. Par exemple, pour 
tacc = 100 ns et ttfr = 1 200 ns, on obtient n = 12. 

Tacc et ttfr sont alors des crit feres 
caract£ristiques de la performance du systfeme raultiprocesseur 

25 conforme a l'invention et la mise en piece de n registres a 
decalages m§moires RDMj est compatible avec un nombre 
sup£rieur de liaisons series LS. qu f a la condition 

w 

d4ntercaler une loqique de type reseau d 'i nt erconnexi on RI 
entre registres et liaisons, l f af f ectat ion d'un registre 

30 memoire RDMj a une liaison s§rie LSj.ttant r£alisee de fagon 
dynamique par le processeur de gestion memoire PGM. 

Par ailleurs, la mdmoire centrale RAM sera 
g£n£ralement constitute par m bancs mdmoires RAM^, ••• RAM p , 
RAM m agencds en perallfeles, cheque banc memoire comportant n 

35 registres & decalages RDMj relics par un reseau 
d'in terconnexion RI p b I'ensemble des liaisons series L 5 j . II 
est alors possible, sous reserve que les adresses de blocs 
soient unif ormdment distribu£s sur les bancs mSmoires RAM p , 
d'obtenir une performance th£orique de m x n registres a 

40 decalages simul tenement actifs. La distribution uniforme des 
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adresses est assurSe par des mScanismes classiques 
d ' entrelagages des adresses. 

Sur la figure 20a f on a reprSsentS 
5 partiellement une architecture conforroe a l'invention, 
comportant m bancs mSmoires RAM p avec n registres a dScalages 
RDMj par bancs mSmoires et q unites centrales UCj. Chaque banc 
mSmoire est de type a acces alSatoire dots d'une entrSe/sort ie 
de donnSes de larqeur correspondent a un bloc d'inf orma tions 
10 bi, cette RntrSe/sortie Stent (corome prScSdemment pour la 
mSmoire RAM) reliSe par un bus parallele h l'ensemble des 
registres SISmentaires RDMj^... RDMj p . 

Le rSseau ^'interconnexion est de structure 
connue en soi ("croBS-bar", "delta", "banyan"...). On notere 
15 qu'un reseau multi-Stage est bien adapts dans la mesure ou le 
temps d'Stebl issement du chemin est nSgliqeable devant son 
temps d'occupation (le temps de transfert d'un bloc) et qu'il 
ne concerne qu'un bit par liaison. 

Le processeur de gestion mSmoire PGM est 
20 adapts pour pouvoir assurer I'allocation dynamique d'une 
sortie .a une entrSe du rSseau, c f est-a-dire mettre en relation 
un reqistre a dScalage mSmoire RDMj et une liaison sSrie LSj. 

Dans le cas ou les moyens de commmunication 
d'adresses de blocs sont constituSes par le bus commun RUSA, 
25 le fonctionnement est le suivant : 

En cas de demande de lecture d'un bloc de la 
part de 1'unitS centrale CPUj, le processeur de qestion 
mSmoire PGM p concerns alloue un registre a dScalage RDM if 
commande le rSseau d 1 i n t e rconnex ion RI en consequence et 
30 initialise le transfert. 

En cas de demands d ! Scriture d'un bloc de la 
part de 1'unitS centrale CPUj, un chemin doit au prSalable 
etre Stabli. A cet effet, une premiere requete d'Stablissement 
* de chemin est Smise sur le bus commun BUSA, suivie de la 

35 demande d'Scriture effective des transfert du bloc de la 
mSmoire-cache MCj au registre a dScalage RDMj. Lors de la 
premiere demande, le processeur de gestion mSmoire PGM est 
chargS d'allouer un chemin et de commander le rSseau 
d 1 interconnexion RI. 
40 Dans le cas ou les moyens de communication 
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d'adresses de blocs sont lea liaisons series ellea-memes, un 
chemin doit etre 6tabli h tout pre*alable de transfert. Ce 
probiem6 est identique au problems classique du partage d'un 
5 ensemble de n ressources par m utilisateurs et peut etre r^gle" 
par des solutions classiques d'arbitrages de conflits d'ecces 
(protocoles de communication, signaux supple" mentaires) • 

Dans l'exemple d'architecture represents a la 
figure 5, les reqistres a de*calages RDMj et RDPj, leurs ? 
10 logiques de validation LV1 et LV2 dtaient rSalisSes dans une 
technoloqie rapide, l'ensemble £tant synchronise* par une 
horloge de frequence F au moins £qale h 100 MHz. 

La figure 20b prSsente en variante b 
l'architecture propose*e a la figure 20a f une solution conforme 
15 h I'invention dans* laquelle cheque liaison sSrie LSj, qui 
relie le processeur CPUj a tous les bancs m^moires, est £clate*e 
en m liaisons series LSj p reliant en point en point le 
processeur CPUj h chacun des bancs mSmoires RAM p • 

Ce proce^de" pr6sente le double avantaqe 

20 suiyant : 

- cheque liaison 6tant du type point a point, 
peut mieux etre adaptee du point de vue 61ectriaue ou du point 
de vue fibre optique, 

- un niveau de parallSlisme suppl6 mentai re 
25 est obtenu des lors que le processeur de traitement est en 

mesure d'anticiper des demandes de blocs, ce qui est le cas 

actuellement pour les processeurs les plus performants. 

La loqique d'interface (not6e pr6c6demment 

TFR j et RDPj) qui sst ooocclcc a la liaison serie LSj, c5t<§ 

30 processseur CPUj, est alors dupliquie en m exemplaires I^... 

I ... I«. On notera la presence d'une liaison de maintien de 
p m 

coherence de 1" information , priv6e a cheque banc mSmoire RAM p . * 
Le f onct ionnement de cette liaison est analogue a celui du bus 
SYNCHRO de la fiqure 18. 

35 On a repr6sent6 aux figures 21a et 21b une 

autre structure de mimoire RAM qui comprend 2 U plans m^moires, 
chaque plan mdmoire pr£sentant un front de t/2 u informations 
binaires (pour des raisons de clart6, l'on a represents a la 
figure 21a les moyens nScessaires a la lecture d'un bloc bi, 

40 et a la figure 21b les moyens n^cessaires a l'£criture). Les 
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registres b decalages RDM j ou RDPj sont constitues de 2 U sous- 
registres h decalages eiementaires RDM j p a t/2 u bits de 
capacity. L'exemple pr<§sentf§ h la figure 20 est une 
5 realisation a 8 plans mSmoires (u = 3). (Pour la clarte du 
dessin, il a ete represente un seul registre a decalage RDM j 
form^ pour l'ensemble des sous-regis t res RDMj p ). Cheque plan 
m6moire RAM p comporte en regard de son front d'accfes un 
ensemble de registres a decalages eiementaires RDMj p et est 
10 capable de fonctionner avec une frequence de decalage d'au 
moins F/2 U . 

Le f onctionnement de l'ensemble en cas de 
lecture est illustre h la figure 21a. Un bloc est lu de fagon 
syrtchrone dans l'ensemble des 2 U plans memoires et charge de 

15 meme dans les registres eiementaires de meme rang. Les sorties 
series de ces registres sont connectees aux entrees d'un 
multiplexeur MUXR realise en technologie rapide ( A SG A ) . Un 
circuit de ce type, parfaitement adapte, est disponible chez 
"GIGABIT LOGIC", sous la reference "10G040", et est capable de 

20 deiivrer un signal loqique 6 une frequence de 2,7 GHz. I] 
fournit par ailleurs une horloge de frequence divisee par 
huit, qui constitue l'horloge de decalage des registres 
eiementaires RDMj p . 

En cas d'^cri ture, un f onctionnement 

25 symetrique, presente a la fiqure 21b, est obtenu avec un 
circuit de multiplexeur DMUXR du meme fabricant (reference 
"10G41"), avec les memes caracteristiques de performances. 

On obtient einsi une frequence de transfert 
de 500 M H 7 *ven 8 registres eiementaires fonctionnant fe.une 

30 frequence de 500/8 = 62,5 MHz, ce qui les rend realisables 
dans une technologie plus conventionnelle ("M05" par exemple). 

Les circuits mul t iplexeur s et demultiplexeurs 
references ci-dessus sont combinables en ensembles de 16, 
3 32, ... bits. Ainsi, en associant respect ivemen t 16, 32 plans 

35 memoires fonctionnant b 62,5 MHz, il est possible d'obtenir 
des debits de 1 et 2 GHz, soit un niveau de performances 2 a 4 
fois superieur. 

II est a noter que la logique TFR peut etre 
realisee sur l'un des reaistres eiementaires, et que la 
40 logique de validation LV est integree aux circuits " A SG A" 
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(sortie h collecteur ouvert). 

La figure 22 pr6sente la structure gdnSrale 
d'un composant de type circuit int6gr£ "VLSI*, d«§nomme* 
5 "mSmoire multiport s6rie" et susceptible d f 6quiper un systfeme 
multiprocesseur conforme a l'invention. Ce composant peut §tre 
utilise dans 1 1 architecture multi-processeurs d 6 c r i t e 
pre*cgdemroent, soit pour rSaliser la m^moire centrale RAM et 
les registres a dScalage RDMj associe\s, solt pour rSaliser 
10 chaque me" mo ire-cache MCj et son registre a d6calage RDP j. Pour 
simplifier les notations, on a qard6 danB la description qui 
suit les symboles relatifs a la m^moire centrale RAM et les 
registres a dexalage associ€s* 

La liste des broches de ce circuit avec les 
15 signaux correspondents est la suivante : 

- adbloc 0 -adbloc m-1 : m bits d'adresses de 

bloc bi, 

- admotg-admoti^ : k bits d'adresses de mots 

dans le bloc, 

20 - numreg 0 -numreg nwl 1 n bits d'adresses de 

registres rd, 

- cs : "chip select" : signal de selection du . 

circuit, 

- vTF : "write" : signal d*6criture, 
25 - Td : "read" : signal de lecture, 

- bit/bloc : signal de commande de la 
f onction multiport, 

• normal / conf ig : siqnei d e m o d e J e . 

f onctionnement , 
30 - dataQ-dat a i 1 bits de donn^es, 

" n l" n n : n s *°< naux d'horloge, * 

- d2~d n t n signaux de donn^es. 

Les valeurs m, n, 1 sont fonctions de l*6tat t 
courant de technologie. Des valeurs actuelles pourraient etre 
35 les suivantes : 

- m = 16 soit 2* 6 blocs bi de 64 bits chacun 

(soit A Mbits), 

- n = 3 soit 8 registres rd, 

- 1 = 8 soit un interface parallele de type 

40 octets, 



SS0022002266 



WO 89/06013 



PCT/FR88/00608 



77 

. k : 3 du fait de la presence de 8 octets 

par bloc. 

Le composant vis£ comporte une clnquantaine 

5 de broches. 

Ce circuit m^moire raultiport s6rie est 
> compost d'une memoire vive a scces alSatoire RAM, de largeur 

predetermined t, susceptible d'etre commanded en ecriture sur 
* des fronts independents de largeur t/4 (valeur choisie 6 titre 

10 d'exemple sur la figure 22) et t/1. Les lignes de donnSes de 
cette memoire RAM sont relives aux entries d'une logique de 
type "barillet 11 B5 ("Barrel shifter"), ou de multiplexage MT, 
selon la version de composant, la logique de multiplexage MT 
pouvant etre considered comme offrant un sous-ensemble des 

15 possibilited de la logique "barillet" et done plus simple h 
redliser. Les signaux d'adresses et de commande de cette 
memoire RAM, h savoir csi, wri, rdi, adbloci, sont ddlivred a 
partir d'une logique de commande COM. Cette logique COM recoit 
en outre les signaux d'inf ormations des broches <Ts, wr, FU , 

20 bit/bloc, normal/conf ig, numreq et est relive, d'une part, par 
des lignes de commande "format" ,&'la logique de type 
"barillet" BS, d'autre part, a la sortie d'un reqistre de 
configuration RC1, et a l'entred d'une logique de selection 
L5R fournissant des signaux srri Q ,.., srd^j et src^. src 2 , 

25 SPC3. Les sorties rie la loqique de type barillet BS 
constituent un bus interne de communication parallele BUSI, 
reliS b un ensemble de registres a ddcalages RD Q , ... R n n _i> 
d'une part, sur leurs entries paralleles et, d'autre part, sur 
leurs sorties paralleled h travers des buffers de validation 

30 BVlOOg,... BV100 n-1 et a 1'entred parallele des registres de 
configuration RCj, RC 2 -*- RC^. 

Les 1 bits de faible poids du bus BUSI sont 
e*galement regus sur les 1 broches datag... data^j. Cheque 
reqistre a ddcalage RD j[ et des portes logiques associeds 

35 constituent une unite* f one t i on n.e 1 1 e ELRDj , piloted par un 
ensemble d'«§l<§ments logigues qui constituent une logiaue de 
forgage LF^ • Chaque unite 1 f onctionnelle ELRD f comporte des 
portes logiques ET100 i et ETlQlj, relives sur l'une de leur 
entree a la sortie ard^ de la logique de selection L5R, et 

AO recevant sur leur autre entred respec ti vement les signaux 
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et wr^ La sortie de la porte logique ETIOO^ est relive a 
l'entrde loadlOO^ du registre a dScalage RD if ainsi qu'a 
l r entr6e loadlQl^ et a I'entrSe S respecti vement d'un compteur 
5 CPTlOOj^ et d'une bascule BIQO^ eppartenant a la logique de 
forgage LF^. La sortie de la porte logique ETIOI^ est relide a 
l'entr£e de commande des buffers de validation BVIOO^. La * 
sortie di est connects a la sortie d'une porte logique PLj, 
qui regoit sur son entree de donnSe la sortie s£rie du 

10 registre a dGcalage RD^ et sur son entree de commande la 
sortie d'une porte logique OUIOO^. Le signal issu de la broche 
h^ est de'livre* a l'entr6e clklOOj, d ii registre RD^ ainsi qu'a 
l'entrde downlOO^ du compteur CPTIOO^. La sortie z^rolOO^ du 
compteur CPTIOO^ est relive a l'entr£e_.R de la bascule BlOOj. 

15 La logique de forgaqe LF.^ comporte en outre 

un multiplexeur MUXIOO^^ qui regoit sur ses entries de donnees 
les valeurs t et t/4. La sortie de donnde du multiplexeur 
MUX100- est relive a I'ehtrde de donne^e du compteur CPTIOO^, 
et la commande de selection sellOO^ du multiplexeur MUXIOO^ 

20 est relive a la sortie 1 du registre RC^. La sortie Q de la 
bascule BlOO^ est relive a l'une des entries d'une porte 
logique ET102 i , qui regoit sur son autre entree le signal issu 
de la broche i d'un reqistre RC 2 - La sortie de la porte 
logique ET102 i est relive a l'une des entries de la porte 

25 logique QUIOO^ qui recoit sur son autre entree le signal issu 
de la broche i d'un registre RC^. Les entries de chargement 
des registres RC^, RC 2 f RC3 regoivent respect ivement les 
signeux src^, srC2t src^ issus de 1» Inoinite de «?e\l,ec tj.on LSP- 
Ce comppsant pr^sente une duality de 

30 f onctionnement t si le signal bit/bloc est dans l'6tat "bit", 
alors le f onctionnement de ce composant est celui d'une * 
m€moire a semi-conducteur con ven tionnel le : les signaux adbloc 
associ£s aux signaux admot constituent le bus d'adresse en r 
u n i 1 6 mot (8 bits dans 1' example), les signaux cs, r"d , wr ont 

35 le sens habituel attribue* b ces siqneux, et les broches data 
v6hiculent les donnees. 

De fagon interne, en lecture le bloc 
d 'in f orm a t i on d^siqne* par adbloc est lu en m^moie RAM et 
presents a l'entrfie de la logique de barillet B5 ou de 

40 multiplexaqe MT. La combinaison des signaux admot et bit/bloc 
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permettent a la logique de commande COM de fournir a la 
loqique de barillet BS ou de roultiplexage MT les signaux 
"format"- Le mot concerns* est alora cadre* a droite en sortie 
5 de la logique de barillet ou de multiplexage et pr^sente* ainsi 
sur les broches de donn£e data. 

De facon interne, en dcriture le mot prSsente* 
sur les lignes de donn£e data est cadre* par la logique de 
barillet L5 ou de multiplexaqe MT par les memes signaux de 

10 commande format qu'en lecture, en regard de sa position dans 
le bloc. La logique de commande COM £met alors un signal 
d'6criture wri partiel sur le seul "troncon" de ro£moire 
concern^, et a l'adresse d£siqne> par les signaux adbloc. 

Si le signal bit/bloc est dans l»<5tat "bloc", 

15 alors le f onctionnement depend de l'6tat du signal 
normal/conf ig. Le mode config programme lesregistres de 
configuration RC^, RC 2 > RC3 adress^s par les signaux numreg, 
et programmes a partir des lignes de donndes data. Le registre 
RC 1 permet de modifier la taille du bloc : t et t/4 dans 

20 l'exemple, aoit 64 bits et 16 bits. De facon interne, le 
f onctionnement est similaire a celui demerit dans le mode de 
f onctionnement "bit" : t ou t/4 bits sont cadres sur le bus 
interne BUSI (en lecture), ou en regard du "troncon" de bloc 
concerne* (en Scriture). Des tailles de blocs multiples peuvent 

25 etre envisages (t, t/2, t/4...). 

Le registre RC3 permet de choisir pour cheque 
registre un sens permanent de f one t i onnement : soit en entree 
(RC3 i = 0) soit en sortie (RC3 i = 1). Ce sens permanent permet 
d'edapter Is c-sa pcsan.i aux liaisons series a liens 

30 unidirectionnels permanents. Le reqistre RC 2 permet de choisir 
pour cheque reqistre, sous reserve que le bit correspondent de 
RC3 soit a l*£tat logique 0, un mode de f onct ionnement a liens 
bidir ectionnels alterne*s : sur une lecture m^moire RAM, le 
registre a d^calage RD^ concerne* "passe" en mode sortie pour 

35 le temps de la transmission du bloc, puis revient a l'£tat de 
repos en mode "entree". De fagon interne, la bascule BlOO^ 
qui pilote la porte loqique PL if est mise a 1 sur un siqnal de 
chargement du registre R D M ^ et remise a 26 to a 1 1 issue du 
trensfert des t ou t/4 bits, par 1 'intermedial re du compteur 

40 CPT100. initialise a t ou t/4 selon I'etat du registre RC 2 , 
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et qui revolt sur son entrde de dScomptage les impulsions 
d'horloqe hi. En f onctionnement normal (signal normal/conf ig 
dans l'£tat normal) pour une lecture, le bloc adress£ par les 
5 broches adbloc est charge dans le registre RD,^ adresse* par les 
broches numreg. Si le bloc est partiel (t/4), alors il est 
transrois en position faible poids sur le bus interne BUSI par ft 
la logique de type barillet B5 ou de multiplexage MT. Ce bloc 
est alors transmis des activation du signal d'horloge hi. 9 

10 En f onctionnement normal pour une Scriture, 

le contenu du registre RD^ adresse 1 par les broches numreg est 
ecrit dans le bloc mdmoire RAM d'adresse adbloc. Si le bloc 
est partiel, il est transmis en position fort poids sur le bus 
interne BUSI, puis cadr6 en "regard" du troncon de bloc 

15 concern^ par la logique de type barillet BS ou de multiplexage 
MT, et enfin un signal partiel d'Scriture wri est 6mis sur le 
troncon concern^. 

II est a noter que si un bloc partiel est en 
service, alors 1'adresse de ce bloc partiel dans le bloc est 
20 fournie par les lignes d'adresse admot. 

Ce composant est parfaitement adapts aux 
diverses variantes d 1 architectures dScrites. Associ£s en 
parallfele, 8, 16... circuits de ce type permettent de re*aliser 
le dispositif dScrit aux figures 20a, 20b. Si la m^moire RAM 
25 est en technologie rapide, alors ce composant peut 6galement 
etre utilis6 au niveau de la m£moire-cache, en mul tiplexant , 
selon le dispositif d^crit aux figures 20a, 20b, les reqistres 
internes d'un m§me composant. 
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REVENDICATIONS 
1/ - Systeme Riultiprocesseur, du type 
comprenant une rn^moire centrele (RAH) organised en blocs 
5 d'inf ormations (bi), des procesaeurs de traitement (CPU 1 ... 
CPUj... CPU n ), une memoire-cache (MCj) relive a cheque 
processeu: de traitement (CPUj) et organised en blocs 
d'inf ormations (bi) de meme taille que ceux de la m^moire 
centrale, un repertoire ( R G j ) et son processeur de gestion 
10 (PCj) associd a cheque tn«§ moire-cache (MCj), des moyens de 
communication d'adresses de blocs entre procesaeurs (CPUj) et 
mdmoire centrale (RAM), ledit systeme mul ti processeur 6tant 
caract^rise* en ce qu'il est dote* : 

• d'un ensemble de registres a ddcalage, dit 
15 registres-memoire ( RDM j ••• R D M j • • • R0M n ), chaque reqistre 
(RDMj) de cet ensemble 6tant connects a la mSmoire centrale 
(RAM) de facon a permettre, en un cycle de cette mdmoire, un 
transfert parallele en lecture ou Scriture d'un bloc 
d'inf ormations (bi) entre ledit registre et ladite mSmoire 
20 centrale, 

. des registres a d6calage, dits registres- 
processeur (RDP 1 ... RDPj... R D P n ) , chaque reqistre a decaiage 
processeur (RDPj) Stent relie a la me'moi re-cache (MCj) d'un 
processeur (CPUj) de fa<?on a permettre un transfert parallele 
25 en lecture ou dcriture d'un bloc d 1 in f o r m a t i ons (bi) entre 
ledit reqistre a ddcalaqe (RDPj) et ladite mSmoire- 
cache (MCj), 

, U n ensemble de liaisons series ( L S j . . . 
LCj... LS n ), chacune reliant un registre a dscais^ r»£Rsir? 
30 (RDMj) et un registre a decalage processeur (RDPj) et adapte 
pour permettre le transfert de blocs d'inf ormations (bi) entre 
les deux registres considers (RDMj, RDPj). 

2/ - Systeme multiprocesseur selon le 
revendicat ion 1, caractdrisd en ce que : 
35 - chaque registre a d<§calage mSmoire (RDMj) 

et chaque registre a decalage processeur (RDPj) sont dedoublSs 
en deux registres, l'un specialist* pour le transfert dans un 
sens, 1'autre pour le transfert dans l'autre sens, 

- chaque liaison sSrie ( l S j ) comprend deux 
40 liens series unidi rec tionnels de transfert bit a bit, reliant 
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le registre b c!6calage m^moire (RDMj) d6doublg et le registre 
b d£calsge processeur correspondent (ROPj) d£doubl£, ces liens 
(Stent connects auxdits registres pour permettre, l'un un 
5 transfert dans un sens, l'autre un transfert dans 1'autre 
sens. 

3/ - Systfeme m u 1 t i p r o c e s s e u r selon la ? 
revendicationl, caract€ris£ en ce que cheque liaison 
s£rie (LSj) comprend un lien bidirectionnel de transfert bit b » 

10 bit, connects au registre b ddcalege mSmoire (RDMj) et au 
registre b dScalage processeur correspondent (RDPj) et une 
logique (LV) de validation du sens de transfert de fagon b 
permettre un transfert alternd dans les deux sens. 

4/ - Systfeme multiprocesseur selon I'une des 

15 revendica tions 1, 2 ou 3, caract£ris6 en ce que les moyens de 
communication d'adresses comprennent un bus commun de 
communication parallfele d'adresses de blocs (BUSA) reliant les 
processeurs (CPUj) et la mSmoire centrale (RAM) et un arbitre 
de bus (AB) adapts pour g6rer les conflits d'accfcs audit bus. 

20 5/ - Systfeme multiprocesseur selon I'une des 

revendications 1, 2 ou 3, ceract£ris£ en ce que les moyens de 
communication d'adresses comprennent un registre b dScalage 
compl£mentaire (RDCj) connecte sur chaque liaison s6rie (LSj) 
en parall&le avec le registre b d£calage m£moire correspondent 

25 (RDMj) de fa$on b permettre la transmission des adresses par 
les liaisons series et leur chargement dans lesdits reqistres 
& dScalage complement a ires (RDCj), un arbitre de gestion 
d'accfes (ABM) 6 1 a n t r e 1 i 6 auxdits registres a d£calaqe 
complementaires (RDC.) et b la m6moire centrale (RAM) en vue 

30 de pr^lever les adresses contenues dans lesdits registres 
(RDCj ) et de qirer les conflits d'acces b la m£moire centrale 
. (RAM) • * 

6/ - Systfeme multiprocesseur selon l'une des 
revendications 1, 2, 3, 4 ou 5, comprenant des moyens de * 

35 qestion des donn£es partag^es entre processeurs, en vue d'en 
assurer la coherence. 

7/ - Systfeme multiprocesseur selon la 
revendicat ion 6, caract£ris6 en ce que les moyens de qestion 
des donn^es partagSes comprennent : 

40 . un bus special de communication parallele 
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de mots (BUSD) reliant les processeura (CPUj) et la m<§moire 
centrale (RAM), 

. une logique de partition (LPj), associSe a 
5 chaque processeur (CPUj) et adaptde pour diff^rencier les 
adresses des donn<§es part age* es et celles des donndes non 
partag^es de facon a transmettre celles-ci sur les moyens de 
communication d'adresses avec ieur identification, 

. une logique de d^codage (DEC) associ^e a la 
10 m6moire centrale (RAH) et adapted pour recevoir les adresses 
avec leur identification et a igui 1 ler 1 e s donn<§es en sortie 
meSmoire soit vers le registre a d^calage mSmoire correspondent 
(RDMj) pour les donnas non partagSes, soit vers le bus 
special de communication de mots (BUSD) pour les donnees 
15 partag^es. 

8 / - Systeme multiprocesseur selon la 
revendication 6, caract<§ris6 en ce que les moyens de gestion 
des donnees partaq6es comprennent, d'une part, un bus special 
de communication parallele de mots (BUSD) et un bus special 

20 commun de communication d'adresses de mots (BUSAM) reliant les 
processeurs (CPUj) et la m^moire centrale (RAM), d'autre port, 
une logique de partition (LPj), associ<§e a chaque processeur 
(CPU.) et adapted pour dif f <§rencier les adresses des donnees 
pertag«§es et celles des donnees non partegSes, de facon a 

25 aiauiller les premieres vers le bus special commun (BUSAM) et 
les secondes vers les moyens de communication d'adresses de 
bloc* 

9/ - Sysfcfese .7.-1 tiprocssseur selon les 
revendicat ions 4 et 6 prises ensemble, carac t€ri si en ce que 

30 les moyens de qestion des donnees partag^es comprennent un 
processeur de gestion mdmoire (PGM) associe a la m6moire 
centrale (RAM) et un processeur espion de bus (PEj) associe a 
chaque processeur de traitement (CPUj) et au repertoire rie 
qestion correspondent (RGj), chaque processeur espion de bus 

35 ( pc j) et le Processeur de gestion me* moire (PGM) e'tant 
connecte's au bus de communication d'adresses (BUSA) en vue 
respecti vement de surveiller et de traiter les adresses de 
blocs transmises sur ledit bus de fagon a permettre une mise a 
jour de la mSmoire centrale (RAM) et de la ^moire-cache 

AO associe'e (MC*) en cas de detection d'une adresse de bloc 
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preeente dans le repertoire associe (RGj). 

10/ - Systeme multiprocesseur selon lee 
r evendica t ions 4 et 6 prises ensemble, caracterise en ce que 
5 les moyens de qestion des donn^es partagees comprennent un 
processeur de gestion m 6 m o i r e (PGM) associe a la memoire 
centrele (RAM) et un processeur de. maintien de la coherence * 
des donnees partaqees (PMCj) associe a chaque processeur de 
traitement (CPU.) et au repertoire de gestion cor respond ant % 

10 (RGj), chaque processeur de maintien de coherence (PMCj) etant 
connects a un bus de synchronisation (SYNCHRO) pilots par le 
processeur de gestion memoire (PGM), de fscon a permettre une 
mise a jour de la m^moire centrele (RAM) et de la m^moire- 
cache associSe (HC) en cas de detection d'une adresse de 

15 bloc, une mise a jour de la memoire centrele (RAH) et des 
memoires-caches (MCj) h chaque prdlevement d'adresses sur le 
bus commun d'adresses BU5A. 

11/ - Systeme multiprocesseur selon les 
revendicat ions 5 et 6 prises ensemble, caract6ris6 en ce que 

20 les moyens de qestion des donnees partaqees comprennent un 

processeur de gestion memoire (PGM) associe a la memoire 

centrale (RAM) et un processeur de maintien de la coherence 

des donne'es partagees (PMCj) associe a chaque processeur de 

J 

traitement (CPU.) et au repertoire de qestion correspondent 

25 (RG,), chaque processeur de maintien de coherence (PMC*) etant 
J J 
connecte a un bus de synchronisation (SYNCHRO) pilote par le 

processeur de gestion memoire (PGM), de facon a permettre une 

mise a jour de la memoire centrale (RAM) et de la memoire- 

cache associee (MCJ en cas de detection d'une adresse de 

30 bloc, une mise a jour de la memoire centrale (RAM) et des 
me moires-caches (MC -) a chaque preievement d'adresses dens les fr 
registres a decalage compie men taires (RDCj). 

12/ - Systeme multiprocesseur selon l'une 
des revendicat ions 1 a 11, caracterise en ce que : 

35 - plusieurs reqistres a deealaqe processeur 

(RDP^, RDP k + j^...) cor respondent a un ensemble de processeurs 
determine (CPU k , CPU k+1 ...) sont connectds en paralleles a une 
meme liaison s6rie (LS k ), un arbitre local (ABL k ) etant 
associe a chaque ensemble de processeurs (CPU^, CPU^-^...) en 

40 vue d'arbitrer les conflits d'acces a la liaison serie (L5 k ) f 
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- un processeur de gestion memoire (PGM) est 
reli<§ aux moyens de communication d'adresses de blocs et a la 
memoire centrale (RAM) et comprend des moyens de codage 

5 adapt<§s pour associer a cheque bloc d f inf ormations (bi) un en- 
tete d'identif ication du processeur concern** permi chaque 
ensemble (CPU k , CPU k + 1 ...) partaqeant une liaison s<*rie 
donn£e (LS k ) , 

- les processeurs de gestion (PG k> PG |<-».i**^ 
10 associSs aux m<§ moires-caches (MC k , MC k+r ..) des processeurs 

de l'ensemble prtcite (CPU k , CPU k + i...) comprennent des moyens 
de ddcodage de l*en-t§te d f identification. 

13/ - Systeme mul tiprocesseur selon l'une des 
revendications 1 a 12, caractgrise* en ce que chaque registre a 
15 d<§calaqe m<§moire (RDM est connects de facon statique a une 
liaison s6rie (LSj) specif iquement effected audit reqistre. 

14/ - Systeme mul t i pr ocesseu r selon l'une 
des revendications 1 b 12, caracte"ris6 en ce que : 

- un processeur de gestion memoire (PGM) est 
20 associe* a la mSmoire centrale (RAM) et comprend une logique 

(ALLOC) d f af f ectation des registres a dScalage memoire aux 
liaisons series, 

- les registres a d^calaqe memoire (RDMj... 
RDM RD M n ) sont connects de facon dynamique aux liaisons 

25 series (LSj... LSj...) par l'entremise d'un reseau 
d'interconnexion (RI) commands' par le processeur de qestinn 
memoire (PGM). 

15/ - Systeme mul t iprocesseur selon Tune des 
revendications 1 & 14, dans iequel la mtmcire car.trnlc * M ) 

30 est constitute par m bancs mtmoires (RAM^... RAM p ... RAM m ) 
agents en parallele, carac t«§ri s<§ en ce que chaque registre h 
dScalage m<§moire ( RDM j ) est constitue* per m registres a 
decalage <§ 1 6 m en t a i r es (RDMjj... ROM jp ... RDM jm ) relics en 
paralleles a la liaison s«§rie correspondent e (LS j), chaque 

35 registre (5 1 «5 m en t a i r e (RDM jp ) e"tant connects a un banc 
memoire (RAM p ) de facon a permettre, en un cycle dudit banc 
memoire, un'transfert parallele en lecture ou Scriture d'un 
bloc d'inf ormations (bi) entre ledit reqistre £l<§mentaire et 

ledit banc memoire. 
40 16/ - Systeme mul t iprocesseur conforme a la 
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revendication 15, dans lequel chaque liaison s 6 r i e (LSj) est 
e*clat£e en m liaisons series (LSj p ), reliant en point a point 
chaque processeur (CPUj) au registre a d£calage 



£16mentaire ( RDM ^ } 



17/ - Systeme multiprocesseur selon la 
revendication 15, dans lequel chaque banc meir.oire (RAM p ) est 
du type a accfes al£atoire dote" d'une entre*e/sortie de donn£es 
de largeur correspondent a un bloc d ' i n f o r m a t i ons (bi), 
10 caract£ris£ en ce que ladite en t re* e/ sor t ie de chaque banc 
mSmoire (RAM p ) est relive par un bus parallele a l'ensemble 
des reqistres 6ie men taires (RDH lp ... RDM jp^* 

18/ - Systeme multiprocesseur selon l'une des 
revendications 15, 16 ou 17, synchronise* par une horloge de 
15 frequence F au moins £gale a 100 meqahertz, caracterise* en ce 
que chaque registre a d£calaqe e* le" men taire m£moire (RDMj p ) et 
chaque registre a d£caleqe processeur (RDPj) sont d'un type 
adapts pour presenter une frequence de d£calage au moins £gale 
a F.. 

20 19/ - Systeme multiprocesseur selon i'une des 

revendications 15, 16 ou 17 synchronise* par une horloqe de 
frequence F au moins e*qale.e 100 megahertz, caracteris£ en ce 
que chaque registre a d£calage dl^mentaire mdmoire et/ou 
chaque registre a d£calaqe processeur est const itue* d'un 

25 ensemble de 2 U sous-regist res multiplexes ( RDM j p , RDP j p ) , 
chacun apte a presenter une frequence de d£calage au moins 
6 qale h F^u. 

20/ - Proc£d£ d'^change d' inf ormat i ons entre 
une mSmoire centrale (RAM) organist e en hi oca 

30 d 1 inf ormat ions (bi) et des processeurs (CPUj... CPUj... CPU n ) 
chacun dote" d'une m6moi re-cache (MCj) organist en blocs de 
meme taille (bi), et d'un repertoire (RGj) et de son 
processeur de gestion (PGj), de f agon que l'£change entre 
m^moire centrale (RAM) et chaque processeur (CPUj) s'effectue 

35 via la me* moire-cache (HCi) de ce dernier, ledit prnc£de* £tant 
caracterise" en ce que chaque transfert de bloc d' inf o rma ti ons 
(bi) depuis la mdmoire centrale (RAM) vers la mi moire-cache 
(MCj) d'un processeur donn§ (CPUj) consiste : 

. a transferer, en un cycle riemdmoire 

40 centrale, le bloc (bi) de ladite memoire centrale (RAM) vers 
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un registre b decalage memoire (RDMj) de la taille d'un bloc, 
faisant pertie d'un ensemble de registres b decalage (RDMj... 
RDMj... RDM n ) connectes a la n^moire centrale, 
5 , b transferer sur une liaison serie (LSj) le 

contenu du registre b dScalage m^woire ( RDM j ) vers un registre 
b decalage processeur (RDPj) de mime capacity, associe b la 
memoire-cache (MCj) du processeur consider (CPUj), 

•a transferer le contenu dudit registre b 

10 decalage processeur (RDPj) vers ladite memoire-cache (MCj). 

21/ - Procede d'echange d' i nf orma t ions entre 
une memoire centrale (RAH) organist en blocs 
d 1 informations (bi) et des processeurs (CPU^... CPUj... CPU n ) 
chacun dote d'une mdmoire-cache (MCj) organist en blocs de 

15- m femes tailles (bi), et d'un repertoire ( R G j ) et de son 
processeur de gestion (PGj)> de fagon que 1'echanqe entre 
memoire centrale (RAM) et cheque processeur (CPUj) s'effectue 
via la memoire-cache (MCj) de ce dernier, ledit procede etant 
caracterise en ce que chaque transfert de bloc d' inf or ma t ion s 

20 (bi) depuis la m e moi re-cache (MCj) d'un processeur donnd 
(CPUj) vers la memoire centrale (RAM) consiste i 

. b transferer le bloc (bi) de ladite 
memoire-cache consider (MCj) vers un registre a decalaqe 
processeur (RDPj) de la taille d'un bloc, associe & ladite 

25 memoire-cache (MCj), 

. b transferer sur une liaison serie (LSj) le 
contenu du registre & decalage processeur (RDPj) vers un 
registre b decalage memoire (RDMj) de m§me capacite, affecte 
au processeur consider* u«ns un ensemble de registres a 

30 ddcalaqe ( R D M ^ . • . RDMj... RDM p ) connects b la memoire 
centrale (RAM), 

. b transferer, en un cycle de mdmoire 
centrale, le contenu du registre b decalage memoire (RDM j ) 
vers ladite memoire centrale ( RAM ) . 

35 22/ - Composant memoire multiport serie, 

susceptible d'equiper un systeme mul tiprocesseur conforme b 
I'une des r e v e nd i c a t i o n s 1 b 19, caracterisei en ce qu'il est 
constitue par un circuit integre comprenant une memoire b 
acces aldatoire (RAM) de larqeur orede term i nee correspondent b 

40 un bloc d'inf orma tions (bi), un ensemble de registres a 
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dScalage (RDM^,. R D M j • • • RDM p ), chacun de capacity . 
correspondent a la larqeur de la memoire, un bus parallele 
interne (BU5I) reliant 1'acces de la memoire et lea reqistres 
5 a dicalaqe, une loqique de selection d'un registre a 
de"caleqe (L5R) adaptSe pour valider la liaison sur le bus 
interne entre la mfmoire et un registre a d£calege ? 
p r £ d e* t e r m i n 6 , et un ensemble de broches externes 
d'ent vie/ sot tie (adbloc, admot, numreg, cs, wr, rd, hitbloc, « 

10 norm al/con f iq , hi, di) pour I'entrde d'adresses vers la 
memoire (RAM) f pour l'entree d'adresses vers la logique de 
selection (L5R), pour l'entree et la validation de commandes 
de transfert en lecture ou dcri ture d'un bloc 
d 1 informations (bi) entre la memoire (RAM) et les reqistres a 

15 d£calage (RDM j ) , pour l'entree d'un signal d'horloqe vers 
cheque registre a decaleqe (RDMj), pour l'entree bit a bit 
d'un bloc d'inf or mat ions (bi) vers cheque registre a rigcalaqe 
(RDMj) et pour la sortie bit a bit d'un bloc d 1 informations 
de cheque registre a d£calege (RDMj). 

20 23/ - Composant selon la re vendication 22, 

caractSrise* en ce qu'il comprend au moins un registre de 
configuration (RC^, .RC'2>*«) poss£dant des entries de 
proqramma tion, chaque reqistre de configuration Stant relie* a 
une logique de forgage ( L F ) connects a la memoire (RAM) et 

25 eux reqistres a d^calage (RDMj) en vue d'assurer le forgaqe 
d'dtats de ledite memoire et desdits registres a d6calaqe. 

24/ - Composant selon la revendica tion 23 t 
permettant le choix de la taille des blocs d' inf ormat ions (bi) 
traites, caractense eri ce que : 

30 -la memoire (RAM) est decouple en zones 

combinables pour permettre la memorisation des diverges 
tailles possibles de blocs d ' inf ormat ions , s 

- chaque registre a ridcalaqe (RDMj) est 
dScoupe* en trongons combinables pour permettre de charger les * 

35 diverses tailles possibles de blocs d 1 inf ormations, avec des 
derivations aptes a assurer le d^calage correspondent a chaque 
taille, 

- le bus interne (BUSI) est dote d'une 
loqique de multiplexaqe (MI) pour permettre les transferts de 

40 hlocs d'inf ornations (bi) des diverses dailies entre les 
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comhinaisons de zones de la mgmoire (RAH) et les combinaisons 
correspondantes de troncons dea registres h d<§celage (RDMj), 

- un reqistre de conf iqurat ion (RCj^) est 
5 prSvu de capacity correspondent au nombre de tailles de blocs 

possibles, 

- la loqique de forgaqe (LT) relive au 
registre (RC X ) comprend une unitd logique adapts pour 
commander la logique de multiplexaqe (HT) en vue de valider 

10 les transferts de blocs d'inf ormations (bi) dans une taille 
donn^e correspondent au paramfetre contenu dans le registre de 
configuration (RC^). 

2 5/ - Composant. selon l'une des 

revendicetions 23 ou 24, ca rac t<§ris<§ en ce que : 
15 - I'entrSe et la sortie de cheque reqistre b 

dScalaqe (RDMj) sont relives h une m&me broche externe par 
1 • intermeSdiaire d'une porte loqioue ( p Lj)> 

- un reqistre de configuration (RC2) es * 
prSvu de capacity correspondent au nombre de registres h 

20 d^calage (RDMj), 

-la loqique de forgaqe ( L F ) relive au 
registre de configuration (RC 2 ) comprend une unit(§ logique 
adaptSe pour commander les portes loqiques (PLj) en vue de 
forcer le f onct ionnement de cheque registre h d^calage (RDMj) 
25 en mode entree ou en mode sortie en fonction d'un bit contenu 
dans le renistre de configuration (RC 2 ) effects audit reqistre 
h ri«§calage (RDMj). 

26/ - Composant selon l'une des 
revendications 23, 24 ou 25, caract6ris£ en ce que : 
30 I'entr.^e et la surtia 60 raqi-trs h 

d^calaqe (RDMj) sont relives 6 une m&me hroche externe par 
1 • interm^diaire d'une porte logique (PLj), 

- un reqistre de configuration (RC3) est 
pr<§vu de capacity correspondent au nombre de reqistres 0 

35 dScalage (RDMj), 

- la loqique de forcaqe (LF) relive an 
registre de conf iquration (RC3) comprend une unitiS logique 
relive h le commande de lecture de le m^moire (RAM) et adaptde 
pour commander cheque porte logique (PLj) soit en mode sortie 

40 au moment de la lecture de la memoire (transfert de la 



SS0022002279 



WO 89/06013 



PCT/FR88/00608 



90 

mdmoire RAM vers le registre correspondent RDMj) pendant toute 
la dur6e du videge dudit registre b ddcalage (RDMj), soit en 
mode entree, le reste du temps. 
5 2 7/ -Composant selon l'une des 

revendica tions 23, 24, 25 ou 26, carect6ris6 en ce qu'il 
comprend une broche externe d'entrSe (bit/bloc), une ou des > 
broches externes d'entrSe/sortie d'inf orma tions (data), une 
loqiaue de commande (COM) relive a la broche d 1 entree $ 

10 (bit/hloc), aux broches d'ent r^e/sor tie (data), a la mdmoire 
(RAM) et a la loqique de selection (L5R) et adapted selon 
l f 6tat de l*entr<§e (bit/bloc) pour enqendrer soit les 
transferts de blocs d'inf ormations (bi) entre mdmoire (RAM) 
et registres a dScalage (RDM j ) f soit des transferts de hits 

15 directement entre la mSmoire (RAM) et les broches (data). 

28/ - Composant selon les r e vend ications 23 
et 27 prises ensemble, caracte>ise* en ce que les reqistres de 
conf iquration (RC lt RC 2 -«*) s°nt relics .: 

- d'une part a la logique de selection (LSR) 
20 laquelle est adapted pour sSlectionner lesdits reqistres de 

configuration pour des ariresses pr 6 de" t e r m i ne* es effect6es 
auxdits registres, 

- d 1 autre part, a la logique de 
commande (CP.M) laquelle est adapted pour transmettre les 

25 donnSes en provenance des broches d'ent r6e/sortie (data) vers 
lesdits reqistres de configuration en vue de leur 
proqrammation . 

29/ - Composant selon l'une des 
revendicat ions 2i~ a 26, dans iequel sur le bus interne (BUSI) 

30 reliant l'acces de la m 6 m 0 i r e (RAM) et les reqistres a 
decalage (RDM J est interposed une logique de type "barillet" 
(B5) ("barrel shifter 11 ) apte a assurer une oermutation 
circulaire sur les bits de cheque bloc d'inf ormations, ladite 
loqique (BS) poss6dant une entree de commande du pas de * 

35 qlissement en unite* mot connected 6 des broches d'entrSe 
( admot ) . 
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